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序 


“十 二 五 ”时 期 是 全 面 建设 小 康 社会 的 关键 时 期 ,是 深化 改革 开放 、 加 快 转变 
经 济 发 展 方式 的 攻坚 时 期 ,也 是 贯彻 落实 《国家 中 长 期 教育 改革 和 发 展 规划 纲要 
(2010 一 2020 年 )》 的 关键 五 年 。 教 育 改革 与 发 展 面临 着 前 所 未 有 的 机 遇 和 挑战 。 
以 加 快 转变 经 济 发 展 方式 为 主线 ,推进 经 济 结构 战略 性 调整 .建立 现代 产业 体系 ， 
推进 资源 节约 型 .环境 友好 型 社会 建设 ,迫切 需要 进一步 提高 劳动 者 素质 ,调整 人 
才 培 养 结构 ,增加 应 用 型 、 技 能 型 、 复 合 型 人 才 的 供给 。 同 时 ,当今 世界 处 在 大 发 
展 . 大 调整 ,大 变革 时 期 ,为 了 迎接 日 益 加 剧 的 全 球 人 才 、 科 技 和 教育 竞争 ,迫切 需 
要 全 面 提高 教育 质量 ,加 快 拔 尖 创 新 人 才 的 培养 ,提高 高 等 学 校 的 自主 创新 能 力 ， 
推动 “中国 制造 ”向 “中 国 创造 ”转变 。 

为 此 ,近年 来 教育 部 先后 印发 了 《教育 部 关于 实施 卓越 工程 师 教育 培养 计划 
的 若干 意见 兴 教 高 C2011]1 号 )《 关 于 “十 二 五 ”普通 高 等 教育 本 科教 材 建设 的 若 
干 意见 》( 教 高 C2011]5 号 )《 关 于 “十 二 五 ”期 间 实 施 “ 高 等 学 校本 科教 学 质量 与 
教学 改革 工程 ”的 意见 泊 教 高 [2011]6 号 ) 《教育 部 关于 全 面 提高 高 等 教育 质量 的 
若干 意见 兴 教 高 C2012]4 号 ) 等 指导 性 意见 ,对 全 国 高 校本 科教 学 改革 和 发 展 方 
向 提出 了 明确 的 要 求 。 在 上 述 大 背景 下 ,教育 部 高 等 学 校 机 械 学 科教 学 指导 委员 
会 根据 教育 部 高 教 司 的 统一 部 署 ,先后 起 草 了 《普通 高 等 学 校本 科 专 业 目 录 机 械 
类 专业 教学 规范 》《 高 等 学 校本 科 机 械 基础 课程 教学 基本 要 求 》 加 强 教学 内 容 和 
课程 体系 改革 的 研究 ,对 高 校 机 械 类 专业 和 课程 教学 进行 指导 。 

为 了 贯彻 落实 教育 规划 纲要 和 教育 部 文件 精神 ,满足 各 高 校 高 素质 应 用 型 高 
级 专门 人 才 培 养 要 求 ,根据 ( 关 于 “十 二 五 ?普通 高 等 教育 本 科教 材 建设 的 若干 意 
见 ;文件 精神 ,华中 科技 大 学 出 版 社 在 教育 部 高 等 学 校 机 械 学 科教 学 指导 委员 会 
的 指导 下 ,联合 一 批 机 械 学 科 办 学 实力 强 的 高 等 学 校 、. 部 分 机 械 特色 专业 突出 的 
学 校 和 教学 指导 委员 会 委员 、 国 家 级 教学 团队 负责 人 、 国 家 级 教学 名 师 组 成 编 委 
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会 ,邀请 来 自 全 国 高 校 机 械 学 科教 学 一 线 的 教师 组 织 编写 全 国 普通 高 等 学 校 机 械 
类 “十 二 五 ”规划 系列 教材 ,将 为 提高 高 等 教育 本 科教 学 质量 和 人 才 培 养 质 量 提 供 
有 力 保障 。 

当前 经 济 社会 的 发 展 ,对 高 校 的 人 才 培 养 质 量 提出 了 更 高 的 要 求 。 该 套 教材 
在 编写 中 ,应 着 力 构 建 满足 机 械 工 程 师 后 备 人 才 培 养 要 求 的 教材 体系 ,以 机 械 工 
程 知识 和 能 力 的 培养 为 根本 ,与 企业 对 机 械 工程 师 的 能 力 目标 紧密 结合 ,力求 满 
足 学 科 ,教学 和 社会 三 方面 的 需求 ,在 结构 上 和 内 容 上 体现 思想 性 、 科 学 性 .先进 
性 ,把 握 行业 人 才 要 求 , 突 出 工程 教育 特色 。 同 时 注意 吸收 教学 指导 委员 会 教学 
内 容 和 课程 体系 改革 的 研究 成 果 , 根 据 教学 指导 委员 会 颁布 的 各 课程 教学 专业 规 
范 要 求 编 写 , 开 发 教材 配套 资源 (习题 .课程 设计 和 实践 教材 及 数字 化 学 习 资 源 )， 

教材 建设 是 高 校 教学 中 的 基础 性 工作 ,是 一 项 长 期 的 工作 ,需要 不 断 吸取 人 
才 培 养 模式 和 教学 改革 成 果 , 吸 取 学 科 和 行业 的 新 知识 、 新 技术 、 新 成 果 。 本 套 教 
材 的 编写 出 版 只 是 近年 来 各 参与 学 校 教学 改革 的 初步 总 结 ,还 需要 各 位 专家 、 同 
行 提出 宝贵 意见 ,以 进一步 修订 完善 ,不 断 提 高 教材 质量 。 

说 为 之 序 。 





国家 级 教学 名 师 
华中 科技 大 学 教授 博导 
2012 年 8 月 
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优化 设计 是 将 最 优化 方法 与 计算 机 技术 相 结合 并 广泛 应 用 于 工程 设计 问题 的 一 种 科学 的 
设计 方法 。 顾 名 思 义 ,优化 设计 是 寻求 最 佳 技术 经 济 指标 或 最 优 目 标的 设计 方案 , 即 在 给 定 的 
各 种 约束 或 限制 条 件 下 合理 地 确定 各 设计 参数 ,从 众多 的 设计 方案 中 寻找 出 目标 为 最 佳 的 设 
计 方 案 。 机 械 优 化 设计 作为 现代 设计 方法 的 重要 组 成 部 分 ,其 重要 性 也 是 不 言 而 喻 的 。 它 是 
解决 机 械 工程 设计 问题 的 一 种 有 效 手 段 , 对 于 进一步 提高 机 械 设 计 的 水 平 \ 改 善 机 械 产品 的 质 
量 等 均 起 到 了 重要 作用 。 

机 械 优化 设计 是 机 械 类 专业 的 一 门 重要 课程 ,其 目的 是 使 学 生 树立 优化 设计 的 思想 ,掌握 
优化 设计 的 基本 方法 ,获得 解决 工程 实际 问题 的 能 力 。 本 书 是 作者 在 多 年 从 事 机 械 优化 设计 
教学 和 科研 工作 实践 的 基础 上 并 参考 教学 讲义 而 编写 的 ,其 指导 思想 是 立足 于 创新 应 用 型 人 
才 培 养 目标 ,使 学 生 通过 本 课程 学 习 , 掌 握 机 械 优化 设计 的 基本 方法 ,提高 在 机 械 工程 领域 的 
设计 能 力 , 在 今后 的 工作 中 能 够 应 用 优化 设计 方法 解决 工程 实践 问题 。 本 书 可 作为 高 等 学 校 
机 械 类 本 科 生 和 研究 生 的 实用 性 教材 ,也 可 作为 工程 设计 人 员 的 参考 书 。 

全 书 共 分 七 章 。 第 1 章 阐述 机 械 优 化 设计 的 含义 、 机 械 优化 设计 在 机 械 工程 中 的 应 用 及 
发 展 趋势 等 ;第 2 章 阐述 优化 设计 数学 模型 的 建立 和 尺度 变换 .优化 问题 的 极 值 条 件 和 优化 搜 
索 的 过 程 等 ;第 3 章 阐述 黄金 分 割 法 、 二 次 插值 法 等 常用 的 一 维 优化 方法 ;第 4 章 阑 述 梯度 法 、 
牛顿 法 、 共 思 f 梯 度 法 ,坐标 轮换 法 、 鲍 威 尔 法 和 变 尺度 法 等 无 约束 优化 方法 ;第 5 章 阐述 了 可 行 
方向 法 、 随 机 方向 法 、 复 合 形 法 和 惩罚 函数 法 等 约束 优化 方法 ;第 6 章 阐述 优化 设计 中 的 一 些 
特殊 问题 ,如 线性 规划 方法 、 离 散 变 量 优化 和 多 目标 优化 等 ;第 7 章 曾 述 遗 传 算法 和 BP 神经 
网 络 算法 等 现代 优化 设计 方法 。 除 第 1 章 、 第 7 章 外 ,各 章 末 均 附 有 习题 供 读者 练习 。 

本 书 由 河南 科技 大 学 邓 效 忠 ,浙江 理 工大 学 等 志 超 担任 主编 ,浙江 理工 大 学 方志 和 河南 
科技 大 学 李 天 兴 、 河 北 联合 大 学 程 相 文 .辽宁 科技 大 学 张 晓 君 担任 副 主编 。 第 1 章 由 方志 和 、 
等 志 超 编写 ,第 2 章 , 第 3 章 、 第 5 章 由 李 天 兴 编 写 ,第 4 章 由 程 相 文 编写 ,第 6 章 由 张 晓 君 纺 
写 ,第 7 章 由 方志 和 、 笠 志 超 编写 。 本 书 在 编写 过 程 中 吸收 了 不 少 专家 提出 的 宝贵 意见 和 建 
议 , 受 到 浙江 理工 大 学 教材 建设 项 目 资助 ,在 教材 出 版 过 程 中 ,还 得 到 了 华中 科技 大 学 出 版 社 
的 大 力 支 持 , 在 此 深 表 感谢 。 

本 书 在 编写 过 程 中 参阅 了 同行 专家 、 学 者 的 著作 和 教材 ,在 此 谨 致 谢意 。 鉴 于 近年 来 机 械 
优化 设计 的 理论 和 方法 的 发 展 极其 迅速 ,又 限于 编者 水 平 , 书 中 难免 存在 政 漏 或 不 妥 之 处 ,县 
请 广大 读者 批评 指正 。 
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第 1 章 机 械 优化 设计 的 应 用 和 发 展 


最 优化 或 者 理想 化 一 直 是 人 类 在 生产 和 社会 活动 中 所 追求 的 ,如 做 一 个 规划 或 者 设计 ,我 
们 都 期 望 得 到 最 满意 、 最 好 的 结果 。 为 了 实现 这 种 愿望 ,必须 要 有 好 的 预测 和 决策 方法 ,最 优 
化 的 方法 就 是 普遍 采用 的 一 种 方法 。 

优化 设计 是 20 世纪 60 年 代 初 发 展 起 来 的 一 门 新 兴学 科 , 它 是 最 优化 方法 与 计算 机 技术 
相 结合 而 产生 并 应 用 于 工程 设计 问题 的 一 种 科学 的 设计 方法 。 优 化 设计 ,顾名思义 是 寻求 最 
佳 的 效益 或 最 佳 的 设计 方案 , 即 在 给 定 的 各 种 约束 条 件 下 合理 确定 各 设计 参数 ,从 众多 的 设计 
方案 中 寻找 出 目标 为 最 佳 的 设计 方案 ,如 质量 轻 、 材 料 省 结构 紧凑 、 成 本 低 、 性 能 好 、 承 载 能 力 
强 等 。 优 化 设计 正 是 基于 这 种 需要 而 产生 和 发 展 的 ,并 已 广泛 应 用 于 各 类 工程 实践 的 一 种 现 
代 设 计 方法 。 


1.1 机 械 优化 设计 的 含义 


机 械 传统 设计 通常 采用 经 验 类 比 的 设计 方法 。 其 设计 过 程 可 概括 为 “设计 一 分 析 一 再 设 
计 ” 的 过 程 , 即 首 先 根据 设计 任务 及 设计 要 求 进行 调查 ,搜集 和 研究 相关 资料 ,参照 或 类 比 相同 
的 、 现 有 的 较为 成 熟 的 设计 方案 ,凭借 设计 者 的 经 验 , 辅 以 必要 的 分 析 及 计算 ,确定 一 个 合适 的 
设计 方案 ,并 通过 估算 初步 确定 有 关 设 计 参 数 ; 然 后 对 初步 方案 进行 强度 、 刚 度 和 稳定 性 等 性 
能 方面 的 分 析 计 算 , 检 查 其 是 否 满足 设计 指标 要 求 。 如 果 设 计 方案 得 不 到 满足 , 则 进行 设计 参 
数 的 调整 ,并 再 次 进行 分 析 和 校 核 。 如 此 反复 ,直到 获得 符合 要 求 的 设计 方案 为 止 。 很 显然 ， 
这 个 过 程 费时 、 费 力 ,而 且 只 限于 少数 几 个 候选 方案 的 比较 和 分 析 ,一 般 很 难得 到 较为 满意 的 
结果 。 

机 械 优化 设计 是 进行 某 种 机 械 产品 设计 时 ,在 规定 的 各 种 设计 限制 条 件 下 ,优选 设计 参 
数 , 使 某 项 或 几 项 设计 指标 获得 最 优 值 。 工 程 设 计 上 的 “最 优 值 "(optimum) 或 “最 佳 值 ” 系 指 
在 满足 多 种 设计 目标 和 约束 条 件 下 所 获得 的 最 令 人 满意 和 最 适宜 的 值 。 最 优 值 的 概念 是 相对 
的 , 随 着 科学 技术 的 发 展 及 设计 条 件 的 变动 ,最 优化 的 标准 也 将 发 生变 化 。 优 化 设计 反映 了 人 
们 对 客观 世界 认识 的 变化 , 它 要 求人 们 根据 事物 的 客观 规律 ,在 一 定 的 物质 基础 和 技术 条 件 
下 ,得 出 最 优 的 设计 方案 。 

对 机 械 工程 问题 进行 优化 设计 ,首先 需 将 工程 设计 问题 转化 成 数学 模型 , 即 用 优化 设计 的 
数学 表达 式 描述 工程 设计 问题 。 然 后 ,按照 数学 模型 的 特点 选择 合适 的 优化 方法 和 计算 程序 ， 
运用 计算 机 求解 ,最 终 获得 最 优 设计 方案 。 

机 械 优化 设计 具有 传统 设计 所 不 具备 的 一 些 特点 ,主要 体现 在 两 个 方面 。 

(1) 优化 设计 过 程 中 能 使 各 种 设计 参数 自动 向 更 优 的 方向 进行 搜索 调整 ,直到 找到 一 个 
尽 可 能 完善 或 最 合适 的 设计 方案 。 

(2) 优化 设计 的 手段 是 采用 计算 机 进行 数值 计算 。 


机 械 优 化 设计 








1.2 机 械 优 化 设计 方法 在 机 械 工 程 中 的 应 用 


机 械 设 计 工作 的 任务 就 是 使 设计 的 产品 既 具 有 优良 的 技术 性 能 指标 ,又 能 满足 生产 的 工 
艺 性 使 用 的 可 靠 性 和 安全 性 要 求 , 且 消 耗 和 成 本 最 低 等 。 机 械 产品 的 设计 ,一 般 需 要 经 过 和 需 
求 分 析 市 场 调查 ,方案 设计 、 结 构 设 计 、 分 析 计算 、 工 程 绘 图 和 编制 技术 文件 等 一 系列 工作 
过 程 。 

传统 设计 方法 通常 是 在 调查 分 析 的 基础 上 ,参照 同类 产品 ,通过 估算 、 经 验 类 比 或 试验 等 
方法 来 确定 产品 的 初步 设计 方案 。 然 后 根据 校 核 结果 对 设计 参数 进行 修改 。 整 个 传统 设计 的 
过 程 是 人 工 试 凑 和 定性 ,定量 分 析 比 较 的 过 程 。 实 践 证 明 ,按照 传统 方法 得 出 的 设计 方案 ,可 
能 存在 较 大 改进 和 提高 的 余地 。 虽 然 在 传统 设计 中 也 存在 “ 选 优 ”的 思想 ,设计 人 员 可 以 在 有 
限 的 几 种 合格 设计 方案 中 ,按照 一 定 的 设计 指标 进行 分 析 评 价 , 选 出 较 好 的 方案 。 但 是 过 去 由 

受到 计算 方法 和 手段 等 条 件 的 限制 ,设计 者 不 得 不 依靠 经 验 ,进行 类 比 、 推 理 和 直观 判断 等 

一 系列 智力 工作 ,这 样 很 难 找 出 最 优 设计 方案 。 

从 20 世纪 90 年 代 以 来 , 随 着 电子 计算 机 的 发 展 和 普及 应 用 ,优化 设计 方法 广泛 地 应 用 于 
各 个 工程 领域 ,如 空间 运载 工具 的 最 优 轨迹 、 土 木工 程 结 构 设 计 、 水 利 资源 系统 设计 、 电 网 优化 
设计 、 工 三 地 点 选择 的 综合 优化 问题 ,控制 系统 的 最 优 控制 .最 优生 产 规划 .最 优 控制 和 最 优 调 
度 等 。 例 如 , 据 资 料 介绍 , 某 化 工厂 设计 利用 优化 程序 ,在 16 小 时 内 进行 了 16000 个 可 行 方案 
计算 ,从 中 选 出 了 一 个 成 本 最 低 .产量 最 大 的 方案 。 而 过 去 曾 有 一 组 工程 师 工作 一 年 , 仅 能 得 
到 三 个 设计 方案 ,而 且 在 效率 上 没有 一 个 方案 可 以 同 优化 结果 相 比 。 

优化 设计 方法 在 机 械 领 域 应 用 较 早 ,尤其 是 机 构 优 化 设计 ,在 平面 连 杆 机 构 、 空 间 连 杆 机 
构 、 西 轮机 构 以 及 组 合 机 构 设 计 等 方面 都 取得 了 很 好 的 成 果 。 在 机 械 零 部 件 优化 设计 领域 , 国 
内 外 都 进行 了 深入 的 研究 ,如 :液体 动 压 轴承 的 优化 设计 ,齿轮 在 最 小 接触 应 力 情 况 下 的 最 佳 
几何 形状 ,二 级 齿轮 减速 器 在 满足 强度 和 一 定 体积 下 的 单位 功率 所 占 的 减速 器 质量 最 小 , 轴 、 
摩擦 离合 器 ,齿轮 泵 .弹簧 等 的 优化 设计 问题 还 有 专门 著作 论述 ,并且 在 工程 实践 中 ,优化 设计 
方法 与 计算 机 辅助 设计 (CAD) .动态 仿真 设计 等 技术 的 结合 ,使 得 在 设计 过 程 中 能 够 不 断 选 
择 设计 参数 进而 求 得 最 优 设计 方案 ,加 快 设 计 速 度 , 缩 短 设计 周期 。 优 化 设计 的 效益 是 非常 明 
显 的 ,如 美国 Bell 公司 采用 优化 方法 解决 了 具有 450 个 设计 变量 的 结构 优化 问题 ,使 一 个 机 
辟 的 质量 减轻 35%;Boeing 公司 对 747 飞机 机 身 进行 优化 设计 , 收 到 增加 载 员 、 减 轻 质 量 、 缩 
短 生产 周期 和 降低 成 本 的 效果 。 国 内 也 有 很 多 优化 案例 ,如 武钢 对 国外 引进 的 轧机 进行 自主 
优化 改进 后 ,取得 了 很 好 的 经 济 效 益 。 这 些 例子 表明 ,优化 设计 是 保证 产品 具有 优良 性 能 , 减 
轻 自 重 和 体积 ,降低 产品 成 本 的 一 种 有 效 设计 方法 ,同时 也 可 以 使 设计 者 从 大 量 的 繁杂 和 重复 
的 计算 工作 中 解脱 出 来 ,有 更 多 的 精力 从 事 创造 性 的 设计 ,大 大 提高 了 设计 效率 。 

优化 设计 方法 的 发 展 历史 较 短 ,但 发 展 迅 速 ,无 论 在 机 构 综合 .机 械 的 通用 零 部 件 设 计 , 还 
是 在 专用 机 械 和 工艺 设计 方面 都 很 快 得 到 应 用 。 优 化 设计 理论 的 研究 和 实际 应 用 ,使 传统 机 
械 设计 方法 发 生 了 根本 的 变革 ,从 经 验 、 感 性 和 类 比 为 主 的 传统 设计 方法 过 渡 到 科学 、 理 性 和 
立足 于 计算 分 析 的 现代 设计 方法 ,与 创新 设计 方法 、 动 态 设 计 方 法 、 可 靠 性 设计 方法 等 现代 设 
计 方 法 一 起 ,促使 机 械 产品 设计 正在 逐步 朝 自 动 化 、 集 成 化 和 智能 化 方向 发 展 。 

实践 证 明 ,机 械 优 化 设计 方法 是 解决 复杂 机 械 工程 设计 问题 的 一 种 有 效 手段 。 为 此 ,对 于 
机 械 工程 专业 的 高 年 级 学 生 ,在 学 完 机 械 原理 、 机 械 设计 等 设计 理论 与 方法 的 基础 上 ,学 习 机 
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械 优化 设计 的 理论 ,掌握 优化 方法 ,对 于 开拓 设计 思想 ,培养 和 提高 运用 优化 方法 解决 实际 工 
程 问题 的 能 力 是 十 分 必要 的 。 


1.3 现代 机 械 优 化 设计 的 发 展 趋势 


机 械 优化 设计 是 建立 在 现代 机 械 设 计 理 论 发 展 基 础 上 的 ,作为 一 种 新 的 设计 方法 ,其 必须 
与 实际 机 械 工程 问题 相 结合 ,才能 更 好 地 为 工程 实践 服务 。 因 此 ,目前 机 械 优化 设计 与 实际 工 
程 的 结合 在 很 多 方面 得 到 了 发 展 ,在 理论 研究 上 也 得 到 了 拓展 。 例 如 , 整 机 优化 设计 模型 及 方 
法 的 研究 ,机械 设计 的 多 目标 决策 问题 以 及 动态 系统 、 模 糊 系统 、 随 机 模型 可靠 性 优化 、 智 能 
优化 设计 等 一 系列 算法 和 实践 问题 研究 。 

1) 模糊 优化 设计 技术 

常规 的 优化 设计 方法 能 成 功 求解 具有 清晰 定义 结构 ,行为 的 系统 ,这 类 优化 方法 是 基于 清 
晰 的 数字 模型 和 精确 的 数学 方法 。 然 而 ,在 工程 中 还 常常 存在 描述 事件 的 数据 的 非 精确 性 . 语 
言 的 含糊 性 ,统称 为 模糊 性 信息 ,相应 的 系统 称 为 模糊 系统 。 如 何 处 理 模糊 系统 正 是 模糊 优化 
设计 所 要 解决 的 问题 。 目 前 模糊 优化 技术 是 基于 模糊 理论 ,其 思路 是 将 模糊 优化 问题 转变 为 
等 价 的 或 近似 的 确定 性 优化 问题 ,所 以 它 是 将 模糊 理论 与 普通 优化 设计 相 结合 的 一 种 新 的 优 
化 理论 和 方法 。 研 究 模 糊 环境 下 非 线性 规划 问题 的 描述 和 基本 智能 化 的 优化 方法 是 研究 模糊 
优化 理论 和 方法 的 重要 内 容 。 

2) 面向 产品 创新 设计 的 优化 技术 

产品 创新 理论 .方法 与 工具 技术 研究 的 宗旨 是 从 产品 的 工作 特性 和 功能 目标 出 发 ,在 特定 
技术 经济 和 社会 等 具体 条 件 下 ,根据 相 邻 学 科 的 原理 ,创造 性 地 设计 产品 ,并 使 它 在 技术 及 经 
济 上 达到 最 佳 水 平 。 因 此 ,建立 产品 创新 设计 的 优化 技术 是 实现 产品 创新 设计 的 一 个 关键 技 
术 问 题 。 

3) 广义 优化 设计 技术 

传统 优化 方法 往往 只 适用 于 简单 零 部 件 , 而 广义 优化 是 把 对 象 由 此 扩展 到 复杂 零 部 件 、 整 
机 、 系 列 产品 和 组 合 产品 的 整体 优化 , 称 为 全 系统 优化 。 广 义 优 化 设计 的 学 科 体 系 可 以 分 成 三 
个 层次 : 第 一 是 广义 优化 设计 理论 和 方法 学 ,主要 研究 广义 优化 设计 的 本 质 、 范 畴 .进程 、 目 
标 、 理 论 框 架 体系 ,与 其 他 学 科 间 的 关系 ,优化 规划 、 建 模 、 搜 索 、 协 同和 过 程控 制 的 理论 及 技术 
基础 ;第 二 是 广义 优化 设计 方法 和 技术 ,主要 研究 优化 规划 、 建 模 、 搜 索 . 协 同 、 控 制 . 评 价 与 决 
策 等 环节 的 具体 方法 和 实现 策略 ;第 三 是 广义 优化 设计 工具 ,主要 研制 广义 优化 设计 的 支撑 软 
件 和 应 用 软件 。 同 时 ,企业 建 模 和 规划 策略 技术 、 复 杂 系 统 优化 算法 、 工 程 数 据 技术 等 均 是 广 
义 优化 设计 技术 的 研究 内 容 。 

4) CAD/CAPP/CAM 集成 系统 中 的 优化 技术 

CAD/CAPP/CAM 集成 系统 是 目前 产品 设计 制造 的 一 种 先进 技术 方法 ,通过 对 产品 的 三 
维 建 模 、 运 动 分 析 、 动 力 分 析 、 应 力 分 析 , 确 定 零 部 件 的 合理 结构 形状 ,自动 生成 工程 图 样 文件 ， 
再 由 CAPP/CAM 系统 对 数据 库 中 的 图 形 数据 文件 进行 工艺 设计 及 数控 加 工 编程 ,控制 数控 
机 床 完 成 加 工 制造 。 在 这 一 集成 系统 中 需要 进一步 研究 的 是 :产品 开发 过 程 的 静 动态 描述 
( 建 模 ) 方 法 、 图 形 化 显示 ,编辑 技术 以 及 在 资源 约束 下 产品 开发 过 程 的 优化 算法 ,提出 改进 的 
产品 开发 流程 ;产品 开发 的 结果 能 进行 综合 性 的 优化 处 理 , 得 出 经 济 上 最 合理 ,技术 上 最 先进 
的 最 优化 设计 方案 和 产品 。 
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5) 智能 优化 算法 及 其 研究 趋势 

20 世纪 80 年 代 以 来 ,一 些 新 疾 的 优化 算法 ,如 人 工 神经 网 络 (neural networks)、 遗 传 算 
法 (genetic algorithm) 、 进 化 算法 (evolution algorithm) ,模拟 退火 (simulated annealing)、 和 声 
搜索 算法 (harmony search algorithm) 及 其 混合 优化 策略 等 ,通过 模拟 或 揭示 某 些 自然 现象 或 
过 程 而 得 到 发 展 ,其 思想 和 内 容 涉及 数学 .物理 学 .生物 进化 .人 工 智 能 .统计 力学 和 神经 系统 
等 方面 ,为 解决 复杂 问题 提供 了 新 的 思路 和 手段 。 由 于 这 些 算法 构造 的 直观 性 和 自然 机 理 , 被 
称 为 智能 优化 算法 (intelligent optimization algorithm) 。 智 能 优化 算法 在 解决 大 规模 组 合 、 全 
局 寻 优 等 复杂 问题 时 具有 传统 方法 所 不 具备 的 独特 优越 性 ,并 且 鲁 棒 性 强 , 适 于 并 行 处 理 ,在 
计算 机 科学 .优化 调度 .运输 问题 .组合 优 化 等 领域 得 到 了 广泛 研究 与 应 用 。 


1.4 本 课程 的 主要 内 容 


本 课程 的 主要 内 容 包括 优化 设计 问题 数学 模型 的 建立 ,传统 优化 方法 以 及 现代 优化 方法 
三 部 分 。 在 解决 工程 优化 问题 时 ,首先 需 将 优化 设计 问题 抽象 成 优化 设计 数学 模型 ,简称 优化 
建 模 。 优 化 设计 数学 模型 是 用 数学 公式 的 形式 表示 设计 问题 的 特征 和 追求 的 目标 , 它 反映 设 
计 指 标 与 各 个 影响 因素 (设计 变量 ) 之 间 的 一 种 依赖 关系 ,是 获得 正确 优化 结果 的 前 提 。 优 化 
建 模 部 分 的 内 容 主 要 包括 数学 模型 的 标准 格式 及 其 组 成 要 素 ,并 通过 具体 工程 实例 分 析 模 型 
建立 的 方法 。 第 二 部 分 是 传统 优化 方法 ,按照 从 一 维 到 多 维 、 从 无 约束 到 有 约束 、 从 单 目 标 到 
多 目标 .从 连续 变量 到 离散 变量 的 顺序 展开 。 一 维 搜索 方法 包括 外 推 法 与 区 间 消 去 法 两 步 , 以 
求 得 一 元 函数 的 最 优点 所 在 的 区 间 和 缩短 区 间 至 足够 精度 , 求 得 一 元 函数 的 最 优 解 与 最 优 值 ， 
它 是 优化 方法 的 基础 。 无 约束 优化 方法 包括 坐标 轮换 法 .鲍威尔 法 、 梯 度 法 .牛顿 法 等 。 约 束 
优化 方法 包括 可 行 方向 法 、 随 机 方向 法 、 复 合 形 法 .惩罚 函数 法 等 。 各 传统 优化 方法 的 基本 内 
容 包 括 算法 原理 、 编 程 步骤 与 特点 。 此 外 ,简要 介绍 了 线性 规划 问题 ,多 目标 优化 问题 和 离散 
变量 优化 问题 的 常用 处 理 方法 。 第 三 部 分 现代 优化 方法 是 传统 优化 方法 的 补充 和 拓展 ,本 书 
从 原理 、 算 法 .应 用 等 方面 对 发 展 比 较 成 熟 和 应 用 广泛 的 BP 神经 网 络 算法 和 遗传 算法 做 了 较 
详细 的 介绍 。 


1.5 本 课程 的 学 习 方 法 


机 械 优 化 设计 课程 具有 很 强 的 理论 性 。 在 现 有 高 等 数学 和 工程 数学 基础 上 学 习 优 化 设计 
方法 时 ,要 注重 掌握 各 优化 方法 的 原理 ,求解 过 程 、 特 点 与 适用 条 件 ,同时 要 牢 牢 把 握 课 程 的 主 
线 : 从 一 维 搜索 到 无 约束 优化 方法 ,再 到 有 约束 方法 ,一 维 搜索 是 整个 优化 设计 的 基础 ,实际 工 
程 优 化 问题 一 般 为 多 变量 非 线 性 多 目标 优化 问题 ,需要 用 约束 优化 方法 来 求解 。 一 维 搜索 、 无 
约束 优化 方法 和 约束 优化 方法 三 者 是 紧密 相关 、 层 层 递 进 的 。 

同时 本 课程 还 有 很 强 的 实践 性 。 在 理解 掌握 各 优化 方法 的 同时 ,作为 一 门 设计 技术 需要 
通过 实践 来 掌握 。 因 此 ,还 需要 强化 上 机 编程 实践 ,加深 对 优化 设计 方法 的 理解 ,同时 提高 纺 
程 能 力 , 进 而 达到 学 以 致 用 的 目的 。 一 般 在 每 一 章 学 习 后 ,需要 安排 大 量 的 上 机 练习 。 鼓 励 研 
究 型 的 学 生 ,在 课程 全 部 内 容 学 习 完 后 ,可 以 对 感 兴趣 的 机 械 设 计 问题 建立 优化 数学 模型 ,并 
进行 上 机 求解 。 目 前 适合 优化 编程 的 计算 机 语言 很 多 ,建议 像 一 维 搜索 ,无 约束 优化 方法 及 约 
束 优化 方法 的 编程 语言 采用 VB、C/C 十 十 ,以 深入 理解 各 优化 方法 的 具体 算法 步骤 并 以 提高 
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编程 能 力 为 主要 目的 ;至 于 在 课程 进入 提高 阶段 , 即 工 程 问题 优化 应 用 阶段 , 则 可 用 Matlab 语 
言 。Matlab 具有 强大 的 科学 计算 、 图 形 处 理 、 可 视 化 功能 和 开放 式 可 扩展 环境 ,其 中 的 工具 箱 
包含 一 系列 优化 算法 和 模块 ,可 用 于 求解 无 约束 优化 问题 \ 约 束 优化 问题 ,线性 规划 等 ,为 在 计 
算 机 上 使 用 各 种 有 效 的 优化 方法 和 解决 实际 工程 问题 创造 了 条 件 。 

学 习 优化 设计 方法 ,是 为 了 将 来 在 工作 中 更 好 地 应 用 。 通 过 对 本 课程 的 学 习 , 了 解 优化 设 
计 的 基本 概念 ,掌握 常用 优化 方法 的 原理 、 算 法 及 应 用 特点 ,初步 树立 工程 设计 中 的 优化 观点 ， 
具备 解决 一 般 机 械 优化 设计 问题 的 能 力 , 这 是 本 课程 的 教学 目标 。 
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任何 机 械 设计 问题 ,总 是 要 求 满足 一 定 的 工作 条 件 .载荷 和 工艺 等 方面 的 要 求 ,并 在 强度 、 
刚度 .寿命 尺寸 范围 及 其 他 一 些 技术 要 求 的 限制 条 件 下 寻找 一 组 设计 参数 或 设计 方案 。 而 优 
化 设计 是 在 满足 设计 参数 的 一 系列 限制 条 件 下 优选 一 组 设计 参数 ,使 得 设计 参数 对 应 的 设计 
指标 达到 最 佳 值 。 它 是 利用 各 种 优化 算法 和 计算 机 程序 来 获取 工程 实际 问题 的 最 佳 方案 的 一 
种 现代 设计 手段 。 

在 进行 优化 设计 时 ,首先 需要 对 实际 问题 的 物理 模型 加 以 抽象 .简化 和 分 析 , 用 数学 语言 来 
描述 该 问题 的 设计 条 件 和 设计 目标 ,在 此 基础 上 构造 出 由 数学 表达 式 组 成 的 数学 模型 。 然 后 , 选 
择 合适 的 优化 方法 ,并 利用 计算 机 编程 上 机 进行 数学 模型 的 求解 ,得 到 一 组 最 佳 的 设计 方案 。 

数学 模型 是 对 实际 工程 问题 的 数学 描述 ,是 优化 设计 的 基础 。 优 化 设计 的 结果 是 否 可 用 ， 
主要 取决 于 所 建立 的 数学 模型 是 否 能 够 准确 而 简洁 地 反映 工程 问题 的 客观 实际 。 在 建立 数学 
模型 时 ,如 果 过 于 强调 准确 或 确切 ,往往 会 使 数学 模型 十 分 元 长 ,复杂 ,增加 求解 的 难度 ,有 时 
甚至 会 使 问题 无 法 求解 ;而 片面 强调 简洁 , 则 可 能 使 数学 模型 失真 ,以 至 于 失去 求解 的 意义 。 
因此 ,建立 数学 模型 的 基本 原则 是 在 能 够 准确 反映 实际 工程 问题 的 基础 上 力求 简洁 ,这 是 优化 
设计 成 功 与 否 的 关键 。 


2.1 数学 模型 的 一 般 形 式 


优化 设计 问题 在 数学 上 可 以 表达 为 以 等 式 或 不 等 式 函数 描述 的 约束 条 件 和 以 多 变量 函数 
描述 的 优化 设计 目标 ,这 就 是 优化 设计 的 数学 模型 。 数 学 模型 是 设计 对 象 的 数学 化 ,用 数学 语 
言 来 描述 实际 设计 问题 的 设计 条 件 和 设计 目标 。 
例 2-1 现 用 一 薄板 制造 体积 为 100 m 的 无 上 盖 的 立方 体 货 箱 ,要求 箱 体 的 长 . 宽 、 高 尺 
寸 不 小 于 5 ma, 并 且 钢 板 的 耗费 量 最 少 , 试 确定 货 箱 的 长 . 宽 、 高 尺寸 。 
解 ”因为 货 箱 的 体积 已 确定 , 则 钢板 耗费 量 最 少 取决 于 钢板 用 料 最 少 , 即 货 箱 的 表面 积 最 
小 。 设 货 箱 的 长 、. 宽 ,高 分 别 为 zk\zz 和 x3, 则 设计 目标 可 确定 为 
SS 王 :zizZzz 十 2(zzzZa 十 zizs)=->mjn 
显然 ,影响 货 箱 表 面积 的 设计 参数 (变量 ) 是 zi .zz 和 zs ,可 写成 向 量 形式 的 设计 变量 
X=[zx: xz zi] 
根据 设计 要 求 的 体积 条 件 和 各 边 长 度 条 件 , 可 确定 如 下 约束 表达 式 
zi 之 5， zz 之 5， Za 之 5， Zizzzs 王 100 
因此 ,该 工程 问题 的 数学 模型 可 写 为 
min 站 ( 下 ) 一 Zizz 十 2(Czzzs 十 Zizs) 
s.t. gl1( 避 ) 一 一 ZI 十 5 委 0 
gz (天 ) 一 一 Zr 十 5 委 0 
gs (于 ) 一 一 zs 十 5 委 0 
hi(X)=zxizsx;—100=0 
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式 中 :s.t. 是 subject to 的 缩写 , 意 为 “ 受 约束 于 ”。 
可 见 ,一 个 优化 数学 模型 涉及 三 个 要 素 :设计 变量 ,约束 条 件 和 优化 设计 目标 。 


2.1.1 设计 变量 与 设计 空间 


工程 设计 问题 中 总 是 包含 着 许多 设计 参数 ,在 确定 设计 变量 时 ,要 对 各 种 参数 加 以 分 析 ， 
确定 出 设计 变量 和 设计 和 常量。 顾名思义 ,设计 变量 是 设计 中 变化 的 量 ; 而 根据 设计 要 求 的 需要 
预先 给 定 的 参数 ,不 能 作为 设计 变量 ,这 些 设计 参数 被 称 为 设计 常量 。 

1. 设计 变量 的 定义 与 表达 

设计 变量 就 是 进行 优化 设计 时 所 要 确定 的 设计 参数 , 它 在 优化 设计 过 程 中 是 不 断 变 化 的 。 
通过 其 变化 ,使 设计 方案 逐步 趋 近 于 最 优 方案 。 从 数学 上 讲 , 所 有 设计 变量 都 应 是 独立 的 自 变 
量 , 它 们 之 间 不 存在 相互 依赖 的 关系 。 如 上 述 例题 中 的 箱 体 的 长 . 宽 、 高 ,以 及 齿轮 减速 器 中 人 齿 
轮 的 齿 宽 , 齿 数 、 模 数 、. 输 入 轴 直 径 .输出 轴 直 径 和 轴 的 长 度 等 均 为 设计 变量 。 

设计 变量 可 以 是 几何 参数 (如 形状 ,体积 ,位 置 等 ) ,也 可 以 是 物理 参数 (如 力 .速度 .加 速度 
等 )。 总 的 来 说 ,一 组 设计 变量 取 值 确定 后 就 代表 着 一 个 设计 方案 ;一 组 值 不 相同 的 设计 变量 ， 
就 代表 着 不 同 的 设计 方案 。 

在 优化 设计 中 ,设计 变量 通常 有 两 类 , 即 连续 设计 变量 与 离散 设计 变量 。 连 续 设 计 变 量 的 
取 值 没有 限制 ,可 以 取 连 续 量 ,如 几何 量 ( 形 状 、 位 置 、 体 积 等 ) 物理 量 ( 力 、 速 度 等 ) 等 ;而 离散 
设计 变量 只 能 取 离 散 的 数值 (例如 齿轮 的 齿 数 、 模 数 等 )。 对 于 离散 设计 变量 , 既 可 用 离散 化 方 
法 求解 ,也 可 在 优化 过 程 中 先 视 为 连续 变量 ,然后 在 优化 结果 的 基础 上 再 做 圆 整 或 标准 化 处 
理 , 使 之 成 为 一 个 符合 实际 问题 的 近似 最 佳 设计 方案 。 

为 了 书写 .表达 及 运算 上 的 方便 ,设计 变量 一 般 用 列 向 量 或 列 阵 的 形式 来 表达 。 例 如 ,对 
于 一 个 具有 7 个 设计 变量 的 优化 设计 问题 ,可 以 用 一 个 维 列 向 量 或 列 阵 来 予以 表达 ，。 


立 1 
并 
X=| “|=[z zx tr XER (2-1) 


式 中 :zi(i 二 1,2,…,n) 是 设计 向 量 关 的 n 个 坐标 分 量 ,代表 了 不 同 的 设计 参数 。 

2. 设计 空间 

在 优化 数学 模型 中 设计 变量 的 数目 称 为 优化 问题 的 维 数 。 如 果 优 化 数学 模型 及 个 设计 
变量 , 则 称 该 优化 问题 为 维 优化 问题 。 

由 设计 变量 的 表达 式 (2-1) 可 知 ,n 个 独立 的 设计 变量 就 确定 了 一 个 n 维 欧 氏 空 间 , 设 计 
向 量 关 是 定义 在 n 维 欧 氏 空间 的 一 个 向 量 或 一 个 点 ( 径 矢 的 端点 )。 这 个 n 维 欧 氏 空 间 是 以 nn 
个 坐标 分 量 zi ,zz ,x3，… ,zx, 为 坐标 轴 的 空间 , 它 构 成 了 设计 空间 ,包容 了 所 有 可 能 的 设计 方 
案 , 且 每 一 个 设计 方案 都 对 应 着 设计 空间 的 一 个 径 矢 或 一 个 点 。 

例如 ,设计 变量 个 数 n= 二 2, 优 化 两 个 设计 参数 , 则 设计 空间 就 是 由 两 个 设计 参数 zi ,zs 为 
坐标 轴 所 构成 的 平面 一 一 设计 平面 ,如 图 2-1 所 示 。 该 平面 上 任 一 点 (zi yzi) 即 代表 一 个 设计 
方案 。 

同 理 , 设 计 变量 个 数 * 一 3 ,优化 三 个 设计 参数 , 则 设计 空间 就 是 由 三 个 设计 参数 (zi ,zs ,zs) 
为 坐标 轴 所 构成 的 三 维 空间 一 一 设计 空间 ,如 图 2-2 所 示 , 其 中 任 一 点 X 一 [zl xz xs] 即 
代表 一 个 设计 方案 。 
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图 2-1 二 维 设计 平面 图 2-2 三 维 设计 空间 


优化 问题 设计 变量 的 数目 越 多 ,其 设计 空间 的 维 数 越 高 ,因而 在 设计 空间 寻 优 的 难度 也 就 
越 大 。 一 般 说 来 ,优化 设计 问题 求解 的 计算 量 是 随 设计 变量 数目 的 增多 而 显著 增加 的 。 

3. 设计 变量 对 优化 设计 的 影响 

设计 变量 的 数目 越 多 ,优化 设计 所 要 确定 的 设计 参数 越 多 ,设计 的 自由 度 越 大 ,优化 的 效 
果 越 好 ,但 优化 工作 量 越 大 ,难度 越 高 。 因 此 ,为 了 使 优化 问题 简单 易 行 ,在 优化 设计 过 程 中 应 
慎重 确定 设计 变量 。 

确定 设计 变量 的 原则 就 是 在 满足 设计 要 求 的 前 提 下 , 尽 可 能 减少 设计 变量 的 个 数 。 根 据 
各 设计 参数 对 设计 目标 的 影响 程度 分 析 其 主 次 ,有 些 能 预先 确定 的 量 可 定 为 设计 常量 ,尽量 减 
少 设 计 变 量 的 数目 ,降低 优化 设计 的 维 数 ,以 简化 优化 设计 问题 。 

按照 设计 问题 维 数 的 多 少 , 通 常 把 优化 设计 问题 规模 分 为 三 类 。 设 计 变 量 个 数 2z<10 时 ， 
可 认为 是 小 型 优化 问题 ;设计 变量 个 数 10 和 ”入 50 为 中 型 优化 问题 ;设计 变量 个 数 z 之 50 则 认 
为 是 大 型 优化 问题 。 机 械 优化 设计 中 大 多 是 中 小 型 的 优化 问题 。 


2.1.2 约束 条 件 与 可 行 域 


1. 约束 条 件 
工程 设计 中 往往 有 许多 技术 上 .经济 上 的 限制 ,具体 反映 在 对 设计 变量 的 一 系列 限制 。 这 
些 限 制 设计 变量 取 值 的 等 式 或 不 等 式 函 数 , 称 为 约束 和 条件。 约束 条 件 用 设计 变量 的 函数 来 进 
行 描述 。 
根据 约束 条 件 对 设计 变量 的 限制 形式 ,可 将 约束 条 件 分 为 等 式 约束 与 不 等 式 约 束 两 类 。 
在 数学 模型 中 ,如 果 约 束 条 件 是 用 数学 不 等 式 来 表示 ,可 将 约束 条 件 称 为 不 等 式 约束 条 件 。 如 
gu(X)SO (一 1,2,3，…，,77) 
或 
gu(K)0 (4u=1,2,3,.…,m) (2~-2) 
不 等 式 约束 可 以 是 “ 宇 0” 形 式 , 也 可 以 是 “二 0” 形 式 , 这 是 人 为 规定 的 。 但 在 选用 别人 的 优化 程 
序 时 ,必须 注意 要 依据 优化 程序 的 规定 而 选择 “ 宇 0” 或 “0” 的 形式 。 
除了 不 等 式 约束 条 件 , 还 会 遇 到 用 等 式 来 表示 的 约束 条 件 , 这 种 约束 条 件 称 为 等 式 约束 条 
件 。 如 
hi(¥X)=0 (v=1,2;3%°, pn) 
等 式 约束 条 件 对 设计 变量 的 约束 较 严 格 。 一 个 等 式 的 约束 条 件 等 价 于 两 个 不 等 式 的 约束 条 
件 , 即 g(X) 二 0 等 价 于 g(X) 和 0 和 一 g(X) 二 0。 
等 式 约束 的 个 数 必须 小 于 设计 变量 的 个 数 。 增 加 一 个 等 式 约束 ;设计 的 自由 度 就 减 小 1。 
当 等 式 约束 的 个 数 与 设计 变量 的 个 数 相等 时 , 解 可 能 是 唯一 的 ,其 至 无 解 , 即 优 化 问题 转化 为 
解 方程 组 的 问题 ; 当 p 这 n 时 该 优化 问题 无 解 。 
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另外 需要 注意 的 是 ,约束 函数 g,(X) 和 hh,(XX) 代 表 的 是 设计 空间 内 的 几何 曲线 或 曲面 , 它 
不 一 定 包 含 全 部 设计 变量 ,可 以 是 部 分 设计 变量 的 函数 。 如 果 g,(X) .h, (XX) 为 非 线 性 函数 ， 
则 优化 问题 为 非 线性 优化 问题 ;如 果 g, (XX) .h,(X) 为 线性 函数 , 且 设 计 目 标 f/f(X) 也 是 线性 函 
数 , 则 该 优化 问题 为 线性 优化 问题 。 

例如 ,优化 设计 问题 

min 三 X) 一 zi 十 三 一 4Z1 十 4 
st。8i (X) 一 一 2 十 zz 一 2 委 0 
gi(X)=7xi = 十 1&0 
ga(X)=—z<0 
该 数学 模型 属于 仅 含 有 不 等 式 约 束 的 优化 问题 ,约束 函数 gi (X) 和 gs(X) 中 包含 了 全 部 设计 
， 变 量 z 和 zz ,而 约束 函数 g3(X) 仅 包含 了 设计 变量 xz1。 另 外 ,约束 函数 gs (X) 为 非 线 性 函 
数 , 所 以 该 优化 问题 是 非 线 性 优化 问题 。 
除了 约束 的 等 式 和 不 等 式 形式 外 ,根据 约束 条 件 的 性 质 , 可 将 其 分 为 边界 约束 与 性 能 约 
束 。 边 界 约 束 就 是 规定 设计 变量 取 值 范围 的 限制 条 件 , 如 约束 
a;<Zzb, (1i=1,2,.…,n) 
式 中 :ai 为 设计 变量 zx; 的 下 限 ;b; 为 设计 变量 z, 的 上 限 。 该 约束 条 件 可 写成 两 个 不 等 式 约束 
函数 的 形式 
g1(X)=a;— Zz<0 
ga(X)=z,—b,<0 

性 能 约束 是 根据 设计 性 能 要 求 所 推导 出 的 数学 表达 式 , 实 际 上 是 对 设计 变量 所 加 的 一 种 
间接 限制 。 对 于 机 械 设计 问题 , 它 一 般 是 非 线性 函数 ,其 几何 意义 表示 为 曲线 .曲面 或 超 曲面 。 
性 能 约束 往往 与 设计 对 象 专业 有 关 , 如 齿轮 传动 的 传动 条 件 .装配 条 件 .接触 应 力 条 件 .弯曲 应 
力 条 件 .刚度 条 件 及 稳定 性 条 件 等 , 均 属 于 性 能 约束 。 性 能 约 东 的 考虑 要 周全 而 不 矛盾 。 

优化 设计 约束 条 件 越 多 ,优化 计算 越 复 杂 。 在 众多 约束 条 件 中 ,应 注意 可 能 存在 的 消极 约 
束 。 所 谓 消极 约束 是 指 在 某 些 约束 得 到 满足 时 ,而 另 一 个 或 几 个 约束 必然 得 到 满足 ,其 作用 被 
覆盖 ,被 覆盖 了 作用 的 约束 称 为 消极 约束 。 如 果 经 分 析 能 确认 是 消极 约束 ,在 建立 数学 模型 
时 ,应 将 其 剔除 掉 。 但 在 一 般 情况 下 ,消极 约束 是 不 易 识 别 出 来 的 。 所 以 ,通常 的 做 法 仍 是 将 
全 部 约束 都 列 出 来 , 编 入 计算 程序 中 求解 计算 。 

2. 可行 域 

在 优化 设计 问题 中 ,由 于 约束 条 件 的 存在 ,可 将 优化 问题 的 设计 空间 分 为 可 行 域 和 非 可 行 
域 两 部 分 。 可 行 域 是 指 满足 所 有 约束 条 件 的 设计 空间 , 即 所 有 可 行 设计 方案 对 应 点 的 集合 ,一 
般 用 符号 了 D 或 2 表示。 同样 , 非 可 行 域 就 是 不 满足 约束 条 件 的 设计 空间 。 

不 等 式 约束 条 件 将 设计 空间 划分 为 两 个 部 分 ,一 个 为 可 行 域 , 另 一 个 为 非 可 行 域 。 如 图 
2-3(a) 所 示 ,约束 函数 g;(X) 志 0(i 二 1,2,3) 的 一 侧 满足 约束 条 件 , 为 可 行 域 ;而 g& (CCX) 二 0(0 一 
1,2,3) 的 一 侧 不 满足 约束 条 件 , 为 非 可 行 域 ( 带 阴影 线 侧 )。 因 此 ,不 等 式 约束 gi (X)、g; (X)、 
ga(X) 的 3 条 约束 边界 可 围 成 一 个 可 行 域 2。 

而 对 于 等 式 约束 , 则 等 式 约束 曲线 ( 超 曲 面 ) 本 身 就 是 可 行 域 ,代表 所 有 可 行 方案 的 点 的 集 
合 , 除 此 之 外 的 其 他 区 域 都 是 非 可 行 域 。 如 图 2-3(b) 所 示 ,约束 曲线 (六 ) = 二 0 为 约束 线 , 其 曲 
线 本 身 就 是 可 行 域 。 

例如 约束 条 件 
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gx(X)=0 





ga(X)=0 


Xl 


0 





(b) 


图 2-3 可 行 域 
(a) 不 等 式 约束 可 行 域 〈b) 等 式 约束 可 行 域 
gi1(X)=—zi 二 zs—2<0 
BE2(X) 一 对 一 2 十 1 委 0 
ga(X)=—zi<0 
的 3 条 约束 边界 线 所 围 成 的 约束 可 行 域 ,如 图 2-4 所 示 。 
所 以 ,根据 优化 问题 的 解 ( 即 设计 点 ) 是 否 满足 约束 条 件 ,可 将 其 分 为 可 行 点 (可 行 解 ) 和 非 
可 行 点 ( 非 可 行 解 )。 满 足 上 所 有 约束 条 件 的 设计 点 均 是 可 行 点 ,和 否则 ,不 满足 约束 条 件 的 设计 点 
是 非 可 行 点 。 如 图 2-5 所 示 ,点 X 位 于 可 行 域内 ,满足 所 有 约束 条 件 , 是 可 行 点 ;点 时 ”在 可 
行 域外 ,不 满足 约束 条 件 g.(X) 三 0, 因 此 是 非 可 行 点 。 


Xx 


gx(X)=0 





ga( X)=0 





图 2-4 ”约束 可 行 域 图 2-5 可 行 点 及 起 作用 约束 
又 如 图 2-4 中 的 设计 点 X= 二 [2 0] ,显然 该 点 不 满足 约束 条 件 g; (X) 二 zi 一 zi 十 1 二 
0, 故 XX 为 非 可 行 点 ;设计 点 X2 =[0.5 1.3]" 满足 约束 条 件 g2(XX) 二 zi 一 xz; 十 1 二 0, 并 满 
足 其 余 两 个 约束 条 件 , 所 以 XX 为 可 行 点 。 
由 此 可 知 ,可 行 域 是 由 所 有 可 行 点 组 成 的 集合 , 非 可 行 域 是 由 所 有 非 可 行 点 组 成 的 集合 。 
可 行 域 内 的 任 一 点 均 代表 一 个 可 行 的 设计 方案 ,存在 等 式 约束 时 ,只 有 不 等 式 约束 可 行 域内 的 
等 式 约束 线 上 的 点 才 是 可 行 的 设计 方案 。 
故 不 等 式 约束 的 可 行 域 可 表达 为 
9={X|g,.(X)<O (wu=1,2,°"%,m)} 
如 果 同 时 存在 等 式 约束 , 则 可 行 域 表 示 为 
o-| 相 (u=1,2,°,m) 
大 (CE Co= 1 wp) 


第 2 章 优化 设计 的 数学 模型 与 优化 过 程 1 


另外 ,根据 设计 点 是 否 在 约束 边界 上 ,又 可 将 约束 条 件 分 为 起 作用 约束 和 不 起 作用 约束 。 
对 于 可 行 设计 点 X% , 若 不 等 式 约束 g;(X*) 二 0, 则 称 第 i 个 约束 条 件 g:(X) 为 可 行 点 X“ 的 
起 作用 约束 ;否则 , 若 g;(X*) 二 0, 则 称 g;(X) 为 可 行 点 X” 的 不 起 作用 约束 。 即 只 有 在 可 行 
域 边界 上 的 点 的 约束 才 起 作用 ,所 有 约束 对 可 行 域内 部 的 点 都 是 不 起 作用 约束 。 对 于 等 式 约 
束 , 凡 是 满足 该 约束 的 任 一 可 行 点 ,该 等 式 约束 都 是 起 作用 约束 。 如 图 2-5 所 示 , 点 X” 位 于 
约束 边界 g1 (3) 二 0 上 , 故 约束 条 件 gi (XX) 三 0 是 点 X” 的 起 作用 约束 ;点 下 ”位 于 约束 边界 
g1(X) 二 0 和 ga(X) 二 0 的 交点 上 ,因此 ,点 X” 的 起 作用 约束 有 两 个 ,g1(X)<0 和 gs(X)<<0。 


2.1.3 ”目标 函数 与 等 值 线 ( 面 ) 


1， 目 标 函 数 

在 优化 设计 中 ,以 多 变量 函数 描述 的 优化 设计 目标 ,被 称 为 目标 函数 。 目 标 函 数 一 般 是 可 
变化 的 设计 参数 的 显 函 数 , 作 为 用 来 评价 设计 方案 优 劣 的 指标 。 目 标 函 数 是 设计 指标 的 数学 
表达 式 ,应 是 所 有 设计 变量 的 函数 。 很 多 几何 量 和 物理 量 都 可 以 作为 目标 函数 ,如 利润 . 力 、 体 
积 , 质 量 及 功率 等 。 优 化 模型 中 目标 函数 十 分 关键 ,因为 它 直 接 影响 着 优化 设计 的 效果 。 

一 般 情况 下 ,目标 函数 可 用 以 下 数学 表达 式 表示 

f (XR)= f(z ,x2 ,i) (2-3) 

优化 的 目标 是 优选 一 组 设计 变量 ,使 得 目标 函数 值 达 到 最 优 值 , 即 f(X)->Optimum。 通 
常 的 优化 都 是 指 极 小 化 , 即 7CX) 一 min, 这 在 算法 及 计算 机 程序 上 都 是 统一 的 。 对 于 极 小 化 
问题 ,目标 函数 值 越 小 ,对 应 的 设计 方案 越 好 。 而 对 于 求 极 大 化 的 问题 (如 利润 等 ), 可 转化 为 
一 A(X) 的 形式 进行 求解 。 

工程 实践 中 的 设计 问题 可 能 会 要 求 多 个 设计 指标 达到 最 优 ,因此 优化 问题 的 数学 模型 有 
时 会 有 多 个 目标 函数 。 根 据 优 化 设计 所 选 定 目标 函数 的 个 数 , 可 将 优化 问题 分 为 多 目标 优化 
问题 与 单 目标 优化 问题 。 单 目标 优化 问题 即 是 追求 一 项 设计 指标 达到 最 优 ,而 多 目标 优化 问 
题 指使 多 项 设计 指标 达到 最 优 。 通 常 ,多 目标 优化 问题 可 经 过 加 权 组 合 后 将 其 转化 为 单 目标 
的 优化 问题 ,如 下 式 所 示 。 


如 
f(X) = > Wf;(X) (2-4) 
i=1 


式 中 :f;(X) 代 表 第 i 个 分 目标 函数 ,i 二 1,2,"… ,gq;W 代表 各 项 设计 指标 的 加 权 系 数 (因子 )。 
加 权 因 子 是 个 非 负 数 ,平衡 各 目标 函数 的 量 纲 , 它 代表 着 各 分 目标 函数 的 重要 程度 。 

如 果 fC(X) 是 非 线 性 函数 , 则 优化 问题 为 非 线性 优化 问题 ;如 果 f(X) 是 线性 函数 , 且 约 束 
函数 g(X) 也 是 线性 函数 , 则 优化 问题 为 线性 优化 问题 。 

优化 设计 的 数学 模型 中 的 目标 函数 ,是 以 设计 变量 表示 设计 问题 所 追求 的 某 一 种 或 几 种 技 
术 经 济 指标 的 解析 表达 式 。 通 常 ,设计 所 追求 的 技术 经 济 性 能 指标 较 多 ,在 建立 目标 函数 时 ,要 
力求 将 影响 技术 经 济 和 性 能 最 为 重要 的 、 最 为 显著 的 指标 作为 设计 追求 的 根本 目标 ,作为 目标 函 
数 , 而 将 其 他 指标 作为 必要 的 性 能 约束 条 件 。 一 般 情况 下 ,所 包含 的 分 目标 函数 越 多 ,设计 结果 
越 完善 , 但 设计 求解 的 难度 增 大 。 因 此 ,在 实际 设计 过 程 中 ,在 满足 设计 性 能 要 求 的 前 提 下 ,目标 
函数 应 简单 .准确 , 尽 可 能 减少 目标 函数 的 个 数 , 并 且 尽 可 能 选用 单 目 标 函 数 进行 优化 。 

2， 目 标 函 数 的 等 值 线 ( 面 ) 

1) 目标 函数 的 几何 表示 

对 于 维 优化 设计 问题 , 它 确定 了 一 个 n 维 设计 空间 ,该 空间 中 任 一 点 都 对 应 着 一 个 目标 
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函数 值 ,而 以 n 个 设计 变量 作为 自 变量 的 目标 函数 的 几何 图 形 需 在 n 十 1 维 空间 中 表示 出 来 。 
例如 ,一 个 设计 变量 的 目标 函数 f(z) ,可 用 二 维 空间 中 的 几何 曲线 来 表示 ;两 个 设计 变量 的 目 
标 函 数 f(z zs), 可 用 三 维 空间 中 的 几何 曲面 来 表示 。 如 图 2-6 和 图 2-7 所 示 。 

f(x1x2) 





图 2-6 一 维 优化 的 几何 表示 图 2-7 二 维 优化 的 几何 表示 


2) 目标 函数 的 等 值 线 ( 面 ) 

从 二 维 优 化 问题 目标 函数 的 几何 图 形 一 一 曲面 片 可 以 看 出 , 当 目 标 函 数 取 一 定 值 , 即 
f(zx1i,zz) 二 c 时 (用 平面 去 截 曲 面 ), 对 应 着 其 几何 曲面 上 的 一 条 平面 截 线 , 这 条 平面 截 线 在 
x10Ozz 坐标 平面 上 的 投影 即 为 等 值 线 。 当 < 取 不 同 值 时 ,就 有 一 组 相似 的 等 值 线 ,每 条 等 值 线 





上 所 有 点 的 函数 值 均 相 等 。 
如 给 定 二 次 函数 
rr et em [2& bz 
f(X)=ax’?i+20xizs 十 5 好 一 [2 za 。 J | 
fu) 当 a 之 0,ac 一 妨 记 0 时 ,A(X) 为 一 椭圆 抛物 面 ,其 几何 表 


示 如 图 2-8 所 示 。 当 目标 函数 值 依次 为 a ,cs，…,cs 时 ， 
得 一 簇 截 线 , 它 在 水 平面 (设计 空间 ) 上 的 投影 为 一 簇 杭 
7Qwzc 圆 曲线 (等 值 线 )。 
由 此 可 知 , 等 值 线 就 是 在 定义 域内 (在 设计 变量 所 构 
成 的 设计 空间 里 ) ,目标 函数 值 相同 的 点 的 集合 或 者 点 的 
连 线 。 当 设计 变量 n 二 2 时 称 为 等 值 线 ,设计 变量 n 二 3 
a 时 是 等 值 面 ,而 设计 变量 nm 二 3 时 称 为 等 值 超 曲面 。 
图 2-8 二 维 目标 函数 的 等 值 线 3) 等 值 线 ( 面 7 的 作用 
目标 函数 的 等 值 线 类 似 于 地 形 图 上 的 等 高 线 , 它 定 
性 地 描述 了 函数 值 在 定义 空间 内 的 变化 规律 。 通 过 它 可 以 直观 地 看 出 目标 函数 的 变化 趋势 ， 
为 理解 目标 函数 的 特性 创造 条 件 。 
等 值 线 的 中 心 点 就 是 目标 函数 的 极 值 点 。 等 值 线 有 一 个 中 心 点 , 则 该 极 值 点 即 极 小 值 点 ， 
这 种 函数 称 为 单 峰 ( 凸 ) 函 数 , 如 椭圆 抛物 面 ;等 值 线 有 多 个 中 心 点 的 函数 称 为 多 峰 ( 凸 ) 函 数 ， 
每 个 中 心 点 都 为 局 部 极 小 值 点 ,而 全 域 极 小 值 点 要 通过 比较 才能 得 到 。 


2.1.4 优化 数学 模型 


优化 设计 是 一 种 规格 化 设计 方法 ,尽管 工程 问题 千差万别 ,但 用 优化 方法 来 解决 这 些 设计 
问题 时 ,所 建立 的 数学 模型 的 格式 是 统一 的 、 完 全 一 致 的 。 优 化 设计 的 数学 模型 的 一 般 形式 为 
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min f(X) 


s.t. gu (KX)ZO (u=1,2,. ,1m) (B56) 
C=0 t= 1 
该 数学 模型 可 描述 为 :在 满足 不 等 式 约束 g, (外) 三 0 和 等 式 约束 h,(X)==0 的 前 提 下 , 优 
选 设计 变量 X=[zi,zz，…yzo] ,使 目标 函数 /(X) 的 值 趋 近 于 最 优 或 最 小 化 , 即 f(X) 一 
min。 目标 函数 的 最 小 值 及 其 对 应 的 设计 变量 值 称 为 优化 问题 的 最 优 解 。 
下 面 通过 几 个 例子 来 说 明 如 何 将 工程 设计 问题 抽象 .简化 和 描述 为 优化 设计 的 数学 模型 。 
例 2-2 某 工厂 生产 A 和 B 两 种 产品 ,A 产品 单位 价格 为 Ps 万 元 ,B 产品 单位 价格 为 Ps 
万 元 。 每 生产 一 个 单位 A 产品 需 消耗 煤 ac 吨 、 电 a 度 、 人 工 ar 个 ;每 生产 一 个 单位 也 产品 
需 消耗 煤 bc 吨 ` 电 如 度 人工 六 个 。 现 有 可 利用 生产 资源 煤 C 吨 , 电 瑟 度 , 人 工 工 个 , 试 确定 
”其 最 优 分 配方 案 ,使 该 三 所 生产 两 种 产品 的 产值 最 大 。 
解 由 设计 问题 的 具体 情况 分 析 可 知 ,产值 大 小 取决 于 所 生产 产品 的 总 价格 ,而 总 价格 又 
由 产品 的 生产 数目 和 单位 价格 决定 。 因 此 ,可 假设 A 和 B 两 种 产品 的 生产 数目 分 别 为 xs 和 
zp， 即 设计 变量 
X 一 [zA ze] ER’ 
由 此 可 得 到 两 种 产品 总 产值 的 表达 式 
P=P, xra Ppxs—max 
根据 设计 要 求 的 生产 资源 煤 、 电 及 人 工 等 限制 条 件 , 可 确定 设计 约束 条 件 为 
XA 之 0， Xp 之 0， aczA 十 bczs 委 C， agxzatbersE, azA 十 加 za 委 了 
因此 ,该 工程 问题 的 数学 模型 可 写 为 
minf (X)=—( (Pazat Pazs) 
s.t. gl(X) 一 acZzA 十 bcza 一 C 委 0 
gz (KX)=agratbers— ESO 
ga(X)=arrat+birs—L<0 
gi(X)=—za0 
L gs (天 ) 一 一 Za 和 0 
例 2-3 2-9 为 某 数 控 机 床 的 高 速 旋转 轴 , 材 料 为 45 钢 。 已 知 该 轴 的 密度 po 一 7. 85X 
10-* kg/mmi ,弹性 模 量 EE 二 200 GPa, 转 速 n= 二 6000 r/min, 轴 的 中 部 安装 质量 Q 二 10 kg 的 齿 
轮 。 给 定 :二 150 mm, 要 求 30<di 志 60,50<<ds 二 100。 试 确定 该 轴 在 满足 动力 稳定 性 条 件 下 
质量 最 小 的 设计 方案 。 





2-9 高速 旋 转轴 示意 图 
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解 〈1) 设计 变量 的 确定 。 
由 题 意 可 知 , 轴 的 各 段 长 度 尺寸 为 常量 , 故 仅 有 轴 的 各 段 直径 尺寸 影响 质量 大 小 , 故 选择 
轴 的 各 段 直径 作为 设计 变量 。 即 
X=[z: zs]'=[d dj] 
(2) 目标 函数 的 确定 。 
轴 的 质量 可 表示 为 
M=prl(2di+d;2)/4 
即 
f(X)=prl(2zxi+ zi)/4>min 
(3) 约束 条 件 的 确定 。 
根据 结构 要 求 , 轴 的 直径 约束 条 件 为 
30 过 di 夺 60， 50 二 d, 声 100 
高 速 旋转 的 轴 类 零件 ,为 了 防止 其 出 现 临界 共振 现象 ,要 保证 动力 稳定 性 。 即 
w<<0. 7w, 


式 中 :w 为 轴 的 角速度 ,二 2xn/60; ,为 轴 的 模 向 振动 固有 频率 ,其 算式 为 w 一 /二 一 








一 一 一 人 8 一 ;55-, 其 中 g 为 重力 加 速度 ,f 为 轴 中 间 截 面 处 静 找 度 。 由 此 可 得 到 约束 
10. 67Qz ( 示 + 二 ) 


条 件 





(4) 规范 数学 模型 为 
minf(X)=prl(2z1+2z2)/4 X=[zx: xz 一 [dd 本 


一 2rx xaE 
st, gi1(X) = —0.7 E38 


10. 67Qzs (i 


下 
EE¥ Xs? 





g2(X)= 一 zi 十 30 寺 0 
g3(X)=zxi—60<0 
g4( 尽 ) 二 一 zy 十 50 寺 0 
gs (X)=z;—100<0 

例 2-4 设计 如 图 2-10 所 示 的 单 级 直 齿 圆柱 齿轮 减速 器 。 已 知 输入 功率 为 也 ,输入 轴 转 
速 为 n, 传 动 比 为 i, 齿 轮 许 用 接触 应 力 为 [on], 主动 轮 和 从 动 轮 的 许 用 弯曲 应 力 分 别 为 Ler ] 和 
[orsj, 轴 的 允许 乒 度 为 [及 ; 轴 的 许 用 弯曲 应 力 [o]。 试 确定 该 减速 器 在 保证 承载 能 力 的 条 件 
下 质量 最 轻 的 设计 方案 。 

解 (1) 确定 目标 函数 。 

齿轮 传动 的 优化 目标 , 较 常 见 的 是 体积 或 质量 最 小 、 传 动 功率 最 大 .工作 寿命 最 长 .振动 最 
小 .启动 功率 最 小 等 。 减 速 器 的 质量 最 轻 , 零 部 件 的 密度 为 常量 , 故 以 体积 最 小 为 优化 目标 ,而 
减速 器 的 体积 主要 取决 于 箱 体 内 齿轮 和 轴 的 尺寸 。 在 齿轮 和 轴 的 结构 尺寸 确定 之 后 , 箱 体 的 
尺寸 将 随 之 确定 ,因此 将 齿轮 和 轴 的 总 体积 达到 最 小 作为 优化 目标 。 所 设计 的 减速 器 内 部 有 
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图 2-10 单 级 直 齿 圆柱 齿轮 减速 器 
两 个 齿轮 和 两 根 轴 , 为 了 简化 计算 ,将 轴 视 为 光 轴 ,设计 目标 可 描述 为 
V =VatVet Vy 十 Ze 二 二 者 (1 十 43) 十 字 d(h 十 ls) 十 全 (d —d2)b 


十 字 ( 虽 —d%)b— 字 (D3 一 D4)(6—c)—4 (全 d3c) 


式 中 :V 和 Vs 分 别 为 两 轴 体 积 ;Va 和 Vs 分别 为 主 、 被 动 齿轮 体积 ;ds 和 dz 分 别 为 两 轴 的 直 
径 ;0 ,ls,l3 分 别 为 轴 的 各 有 段 长 度 ;di ,qd 分 别 为 两 齿轮 的 分 度 圆 直径 ,di 二 mzi ,ds 二 mz,,m 
为 两 齿轮 的 模 数 ;b 为 两 齿轮 的 宽度 ,近似 相等 。 根 据 结构 设计 经 验 公式 ,齿轮 各 部 分 尺寸 关 
系 为 do 三 0. 25(Ds 一 Di1)(4 个 孔 ) ,c==0.265,Di==1. 6dw ,Ds 二 di 一 26, 而 6.ls 和 ls 由 经 验 数 
据 确 定 , 可 认为 是 常量 。 

(2) 确定 设计 变量 。 

由 设计 目标 表达 式 可 知 ,影响 减速 器 体积 的 参数 有 齿 宽 , 齿 数 、 模 数 、 轴 的 长 度 . 输 入 轴 直 
径 和 输出 轴 直 径 。 因 此 ,设计 变量 取 为 

X=[z zo HK RB zm B=6 a mm ly ds ae 


由 此 整理 后 可 得 目标 函数 
f(xX) = 十 入 ) 十 二 项 (4 +l) + [rors)’ zt] 十 二 [Cizrszs78 一 好]z 


一 0. 2x[ (izs x3—20)—(1. 6zx6)° jzx1—0. 2x[0. 25(izxs7x3—26—1. 6x6) J:x 
(3) 确定 约束 条 件 。 
@ 为 避免 发 生根 切 , 应 有 zi 宇 zw 二 17。 得 到 约束 条 件 
gi1(X¥X)=—Zz; 二 +17<0 
@ 为 了 保证 齿轮 的 承载 能 力 , 同 时 避免 载荷 沿 齿 宽 分 布 严重 不 均 , 要 求 16 委 2/mm 委 35, 由 
此 得 
g2(X)=—zxizs 十 16 和 0 
gE5 (下 ) 一 2 一 35 生 0 
@ 传递 动力 的 齿轮 的 模 数 的 限制 条 件 为 
gx4 (下 ) 一 一 zs 十 2 委 0 
@ 根据 工艺 装备 条 件 ,对 主动 轮 和 被 动 轮 的 直径 尺寸 进行 限制 ,有 
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g5 (天 ) 一 二 zs 一 33 委 0 
@ 主 , 从 动 轴 直 径 范围 按照 经 验 取 为 10<ds 二 15,13 志 dw 全 20, 有 

gs (XX)=—zs++10<0 

g71(X)=—xzxs 十 13 夺 0 

gs (¥)=zs—15<0 

gs (XX)=zx6—20<0 
@ 轴 的 支撑 跨 距 按照 结构 关系 4 宇 5 十 2A 十 0. 5d ,其 中 A 为 箱 体 内 壁 到 轴承 中 心 线 的 

距离 (为 常量 ) , 则 有 
gio (RX)=z1+2A 二 0. 5z6 = x 0 

@ 按 齿轮 的 接触 疲劳 强度 和 弯曲 疲劳 强度 条 件 , 有 


_335 /KTi(iT1) 
a = ERY 


2KT 
OFI 一 pa [Lor J 


Y 
OF2 ~ = 一 Lo] 


式 中 :a 为 具 轮 传动 的 中 心 距 ,a==0. 5mxzi (i 十 1) ;K 为 载荷 系数 ,认为 是 常量 ;T= 二 955000P/n 
(格式 ) 为 小 齿轮 传递 的 扭矩 ,由 于 输入 功率 和 转速 已 知 , 故 也 作为 常量 ;YF 、Ys; 分 别 为 小 齿 
轮 .大 齿轮 的 齿 形 系数 ,与 齿 数 有 关 , 对 于 标准 齿轮 ,可 通过 曲线 拟 合 得 到 
Yr 一 0.169 十 0.006666z; —0.000854z? 
Ym 一 0.2824 十 0.003539z; 一 0.00000157z2 


由 此 整理 后 可 得 约束 条 件 
o70 |955000K 元 (i 十 1 
gll 二 ET 
pW RE ed 


XT1X2 XINYF 


1910000KP _[ 


gna(X) Bi NY 


@ 主动 轴 需 满足 刚度 条 件 


orz] 委 0 


LE 
48EJ<L/N 


式 中 :下 , 为 作用 在 小 齿轮 上 的 法 向 压力 ,F, 二 2Ti/(mzicosa) ;J 为 轴 的 惯性 矩 , 对 于 圆 形 剖面 
J 王 rcdsa/64。 经 整理 后 得 到 


122240000Pzs 


gi(X)= 48xEcosar, rx3xt 


@ 主动 轴 满 足 弯曲 强度 条 件 
ot We Ea 


-Lfj<0 


式 中 : 芽 为 轴 上 的 扭矩 ,T=T, 为 常量 ;M 为 轴 所 受 的 弯 矩 ,M 一 一 EL; 为 考虑 扭矩 和 弯 矩 


MX COSa 


的 作用 性 质 差 异 的 系数 , 取 a = 二 0.58 为 常量 ;W 为 轴 的 抗 弯 齐 面 系 数 ,对 实心 轴 仅 ~0. 1d3 。 
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整理 得 约束 条 件 : 


2 
gs (X) = re Ti- 


(Za xs COsa)’ 
Si16( 故 ) 一 [ 十 (aiT,) »)o. lzxi—[Lo]<0 

可 以 看 到 ,该 设计 问题 是 一 个 具有 16 个 不 等 式 约束 的 六 维 优化 问题 。 

通过 以 上 几 个 例子 可 以 看 出 ,每 一 个 实际 问题 的 具体 情况 和 设计 要 求 都 不 相同 ,但 都 是 将 
优化 设计 问题 转化 为 数学 模型 ,该 数学 模型 是 由 设计 变量 、 目 标 函 数 和 约束 条 件 三 个 要 素 组 成 
的 ,其 形式 是 统一 的 \ 完 全 一 致 的 。 

同时 ,由 以 上 几 个 例子 可 知 ,建立 数学 模型 的 一 般 方法 和 步骤 如 下 。 

(1) 选取 并 确定 设计 变量 。 

(2) 准确 而 简洁 地 表达 目标 函数 。 

(3) 分 析 并 确定 约束 条 件 。 

总 之 ,数学 模型 建立 是 优化 设计 的 关键 ,其 三 要 素 的 确定 原则 是 :设计 变量 越 少 越 好 ;性 能 
约束 应 考虑 全 面 周到 , 且 不 矛盾 ;目标 函数 应 简单 ,性 态 稳定 ,这样 就 能 保证 优化 趋向 于 令 人 满 
意 的 效果 。 


2.2 数学 模型 的 尺度 变换 


当 所 建立 的 数学 模型 出 现 诸 如 目标 函数 等 值 线形 状 奇 怪 、 设 计 变 量 的 量 纲 (单位 ) 差 异 较 
大 ,约束 条 件 中 各 变量 的 数量 级 相差 很 大 等 问题 时 ,应 该 对 数学 模型 三 要 素 的 表达 形式 进行 改 
善 。 否 则 ,会 影响 整个 优化 过 程 和 优化 结果 。 所 以 ,出 现 此 类 情况 ,对 数学 模型 进行 适当 的 尺 
度 变换 就 显得 十 分 重要 。 

数学 模型 的 尺度 变换 ,是 指 通过 改变 (放大 或 缩小 ) 在 设计 空间 中 各 个 坐标 分 量 的 比例 ,以 
改善 数学 模型 的 性 态 的 一 种 方法 。 数 学 模型 的 尺度 变换 包括 对 设计 变量 .目标 函数 和 约束 条 
件 的 尺度 变换 。 在 多 数 情况 下 ,数学 模型 的 三 要 素 经 过 尺度 变换 后 ,可 以 加 速 优化 计算 的 收 
敛 , 提 高 计算 过 程 的 稳定 性 。 

1. 设计 变量 的 尺度 变换 

在 优化 设计 中 , 当 设 计 变 量 的 量 纲 不 同 , 或 数量 级 相差 很 大 时 ,可 通过 尺度 变换 对 设计 变 
量 进行 无 量 纲 化 和 量 级 规格 化 处 理 。 例 如 ,在 对 通用 机 械 的 动 压 滑动 轴承 优化 设计 中 ,一 般 取 
设计 变量 
| 天 一 [zi x: zs]'=[L/D C yj’ 
其 中 :L/D 为 轴承 的 宽度 L 与 直径 DD 之 比 ,通常 在 0:2 一 1.0 范围 内 取 值 ,无 量 纲 ;C 为 径 向 间 
孙 , 当 轴 颈 直径 为 12 一 125 mm 时 的 C 值 为 0.012 一 0. 15 mm; 而 /为 润滑 油 的 动力 黏度 ,一 般 
取 0. 00065~0.007 Pa。s。 显 然 ,3 个 设计 变量 的 数量 级 相差 很 大 。 

为 了 使 设计 变量 无 量 纲 化 和 量 级 规格 化 ,进行 尺度 变换 处 理 

ZI 一 Aizi (i=1,2,3,."…,n) (2-6) 

其 中 一 般 取 玉 三 17zt2 (it 一 1,2,3，…72) sx (i 二 1,2,3,…,n) 为 第 i 个 设计 变量 的 初始 值 。 

实践 证 明 ,按照 式 (2-6) 的 方法 处 理 后 ,特别 是 当选 取 的 初始 点 xz?” 比 较 接近 最 优点 zz; 
时 , 则 尺度 变换 后 的 设计 变量 zx; 值 均 在 1 的 附近 变化 。 
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2. 目标 函数 的 尺度 变换 

由 于 工程 问题 的 复杂 性 ,目标 函数 可 能 会 存在 严重 的 非 线 性 ,函数 性 态 恶 化 ,这 种 情况 直 
接 影响 到 优化 程序 的 运行 效率 优化 过 程 的 收敛 性 和 稳定 性 。 通 过 对 目标 函数 的 尺度 变换 ,可 
大 大 地 改善 目标 函数 的 性 态 ,加 速 优化 进程 。 

例如 ,对 于 目标 函数 f(X) 二 144zi 十 47i 一 8z1zs， 如 图 2-11(a) 所 示 , 其 等 值 线 是 一 极为 
扁平 的 椭圆 簇 ,对 优化 过 程 十 分 不 利 。 


X2 


)2 


(a) (b) 


2-11 目标 函数 尺度 变换 前 后 的 等 值 线 变化 
(a) 尺度 变换 前 的 等 值 线 《〈b) 尺度 变换 后 的 等 值 线 
如 果 令 
ZX1=y/12, zz=y2/2 
则 原 目 标 函 数 变 换 为 


人 7 L 
f(D = ty yy 


新 目标 函数 的 等 值 线 如 图 2-11(b) 所 示 。 很 显然 ,函数 f(Y) 的 性 态 比 fA(X) 的 性 态 ( 如 等 值 线 
的 偏心 程度 ) 得 到 了 很 大 改善 ,求解 效率 会 显著 提高 并 易于 求解 。 在 对 新 目标 函数 A(Y) 求 得 
最 优点 Z 二 [y? wi ]" 后 ,再 次 进行 反 变换 
zi =y? /12, xz? =y;? /2 

即 可 得 到 原 目 标 函 数 f(X) 的 最 优点 X* = 二 [zx? 站。 

从 二 维 优化 问题 的 角度 来 看 ,目标 函数 尺度 变换 的 目的 ,就 是 通过 尺度 变换 使 得 目标 函数 
的 等 值 线 尽 可 能 接近 于 同心 圆 或 同心 椭圆 徐 , 从 而 减 小 原 目 标 函 数 的 偏心 率 和 畸变 度 ,加 快 优 
化 搜索 的 收敛 速度 。 但 是 ,实际 工程 问题 的 繁杂 性 决定 了 目标 函数 的 复杂 程度 ,对 此 类 函数 进 
行 尺度 变换 就 存在 相当 大 的 难度 。 因 此 ,目标 函数 的 尺度 变换 并 不 经 常 采用 ,可 采用 变换 设计 
变量 的 尺度 使 各 坐标 轴 的 刻度 规格 化 的 方法 。 

3. 约束 条 件 的 尺度 变换 

实际 优化 设计 问题 的 约束 条 件 个 数 比 较 多 ,尤其 是 性 能 约束 函数 值 的 数量 级 相差 很 大 ,从 
而 导致 此 类 约束 条 件 对 数值 变化 的 灵敏 度 完全 不 同 ,因而 这 些 约束 函数 在 优化 过 程 中 所 起 的 
作用 也 会 与 所 期 望 的 偏差 较 大 。 灵 敏 度 高 的 约束 在 寻 优 过 程 中 会 首先 得 到 满足 ,而 其 余 约束 
条 件 却 几乎 得 不 到 考虑 ,这 样 就 有 可 能 会 得 到 完全 不 同 的 优化 结果 。 因 此 ,在 进行 优化 设计 之 
前 ,应 对 各 约束 函数 进行 充分 地 分 析 , 对 这 种 灵敏 度 相 差 很 大 的 约束 条 件 进行 适当 的 尺度 
变换 。 
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为 了 使 各 个 约束 函数 得 到 相近 的 数量 级 ,可 以 将 它们 同 除 以 一 个 常数 ,使 约束 函数 在 0 一 
1 之 间 取 值 , 这 样 就 可 以 减 小 各 约束 函数 在 设计 变量 变化 时 的 灵敏 度 差 距 ,使 约束 函数 的 特性 
得 到 一 定 程度 的 改善 。 
例如 , 某 设计 变量 的 边界 约束 为 zr 二 zx; 二 x? (xz; 代表 第 i 个 设计 变量 ), 则 该 约束 条 件 可 
写 为 
gi1(X)=zr—z;R0 
ga(¥X)=zi— 7 RO 
为 了 保证 约束 条 件 g1,(X)、gs (XX) 与 其 他 各 个 约束 条 件 具有 相近 的 数量 级 ,可 将 这 两 个 约 
束 条 件 分 别 除 以 各 自 函 数 中 的 极限 边界 值 zr 和 xz? (常数 ) ,使 g1( 关 )、gs (XX) 的 函数 值 均 接近 
于 0 一 1 之 间 。 所 以 ,上 述 两 个 约束 条 件 可 改 为 
gi1(X)=1—z,/z!<0 
gz (XK)=zi/zx —1<0 
例如 ,对 于 等 式 约束 函数 
hi(X)=zi 二 zs—2=0 
h(X)=10°x1—0.9X10%zs—105=0 
对 于 夫 代 点 和 ”二 [1.1 1.0]" ,其 约束 函数 值 分 别 为 hi(X) 二 0.1,h,(X) 二 10”。 实 际 最 优点 
为 XX" 一 [1 1] 。h,( 久 ) 和 hs,(X) 的 灵敏 度 可 表示 为 
WXI=[L 1 ' WRYELI0’ '—0,9X10 J 
很 明显 ,由 于 两 约束 函数 数量 级 相差 很 大 ,因此 其 灵敏 度 差距 很 大 。 如 果 对 心 (X) 王 0 进行 尺 
度 变换 处 理 , 则 约束 函数 变 为 
hs(X)=hs(X)/10: =zi—0,97x,—0.1=0 
这 时 ,对 于 迭代 点 X2=[1.1 1.0J 的 约束 函数 值 分 别 为 hi,(X) 二 0.1,hs(X) 二 0.1。 最 优 
点 不 变 , 仍 是 X" = 二 [l] 1]"。 而 约束 函数 的 灵敏 度 则 变 为 
W(X)=[1 1]', W(X)=[1.0 —0.9] 
可 以 看 到 ,将 约束 函数 进行 尺度 变换 后 ,其 灵敏 度 差 距 就 变 得 很 小 ,这 对 于 优化 过 程 的 搜索 和 迭 
代 是 十 分 有 利 的 。 
但 是 ,如 果 一 个 不 等 式 约束 条 件 是 两 个 设计 变量 之 间 的 比值 函数 , 那 就 没有 一 个 合适 的 常 
数 作为 除数 。 在 这 种 情况 下 ,可 以 用 尺度 变换 后 的 设计 变量 来 建立 约束 条 件 ,或 者 用 一 个 可 以 
改变 其 数值 的 变量 来 除 此 式 , 但 要 注意 不 能 因此 而 改变 约束 条 件 的 性 质 。 例 如 ,在 机 械 设计 
中 ,对 于 强度 .刚度 等 性 能 约束 (co 委 [cj]、j 生 [ 门 等 ) ,约束 条 件 都 可 以 转换 为 如 下 形式 
gi(X)=o/[Lo]—1<0 
gz(X)=f/[fj—1<0 
这 种 把 约束 函数 值 限 定 在 0~1 之 间 的 约束 称 为 规格 化 约束 。 尽 管 规格 化 的 约束 条 件 在 
设计 变量 改变 时 其 灵敏 度 依然 存在 差异 ,但 对 于 解决 问题 仍 能 起 到 一 定 的 改善 作用 。 
实践 证 明 ,设计 变量 的 无 量 纲 化 .约束 条 件 的 规格 化 和 改变 目标 函数 的 性 态 等 方法 ,能 够 
加 快 优化 设计 的 收敛 速度 .提高 计算 的 稳定 性 和 数值 变化 的 敏感 性 ,并 且 为 通用 优化 程序 的 编 
制 提供 便利 。 


2.3 优化 问题 的 极 值 条 件 


无 约束 优化 问题 是 不 存在 任何 约束 条 件 的 优化 问题 , 式 (2-5) 的 数学 模型 可 以 简化 为 
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minf(X) 

i" hi Lr wr ER 
可 以 看 到 ,无 约束 优化 问题 的 极 值 只 取决 于 目标 函数 本 身 。 而 式 (2-5) 的 约束 优化 问题 的 极 
值 不 仅 与 目标 函数 的 性 态 有 关 , 而 且 与 各 个 不 同 的 约束 条 件 密切 相关 。 


2.3.1 无 约束 优化 问题 的 极 值 条 件 


根据 高 等 数学 中 多 元 函数 的 极 值 存在 条 件 ,假设 多 元 函数 f(X) 在 六 点 附近 对 所 有 的 点 
和 都 有 三 (X)>X ), 则 称 点 科 * 为 严格 极 小 值 点 ,f(X" ) 为 极 小 值 ;反之 ,车 f(X) 在 XX 点 
附近 对 所 有 的 点 立 都 有 f(X) 二 f(X* ), 则 称 点 和 X* 为 严格 极 大 值 点 ,f(X" ) 为 极 大 值 。 

1. 无 约束 极 值 存 在 的 必要 条 件 

由 微分 可 知 , 对 于 元 连续 可 导 的 函数 A(X) ,在 XX 点 存在 极 值 的 必要 条 件 为 函数 FCX) 
在 该 点 的 各 一 阶 偏 导数 均等 于 零 , 或 函数 f(X) 在 该 点 的 梯度 等 于 0。 即 
9f/9xr 
9f/9z 


(2=7) 


Vi(X" )= = (2-8) 


9f/9x, X=X" 
满足 极 值 条 件 或 梯度 VA(X" )==0 的 点 称 为 驻 点 。 驻 点 不 一 定 是 极 值 点 ,只 有 满足 充分 条 件 
时 ,才能 判定 驻 点 为 极 值 点 。 
2. 无 约束 极 值 存 在 的 充分 条 件 
设 n 元 函数 1(X) 在 X" 点 存在 连续 的 一 、 二 阶 偏 导 数 , 且 已 满足 函数 极 值 存在 的 必要 条 
件 :W(X" )==0。 将 函数 f(X) 在 点 X' 附近 用 Taylor 二 次 展开 式 来 逼近 ,有 


f(X)=f KX" )+[WR" TX=X" ] 十 广 [X 一 时 了 有 一下] (2-9) 


式 中 : 理 (X"* ) 为 函数 FCX) 在 X 点 的 Hessian 矩阵 ,其 为 FCX) 的 二 阶 偏 导数 矩阵 。 
将 函数 极 值 存在 的 必要 条 件 VA(X* )==0 代入 式 (2-9) ,有 


fCX)— f(x" )=3[X—X* "HX )[X— xX" ] (2-10) 


上 式 右 端 为 变量 [X 一 X" ] 的 二 次 型 。 如 果 及 (X" ) 正 定 , 则 对 于 一 切 天 天 天" ([X 一 XX* ] 关 0) 
恒 有 二 次 型 的 值 大 于 零 , 即 FX) 二 FCX” ) ,XX* 为 极 小 值 点 (也 称 极 小 点 ) ,A(X” ) 为 极 小 值 ;如 
果 电 (X" ) 负 定 , 则 对 于 一 切 关 关 X*([X 一 X* ] 关 0) 恒 有 二 次 型 的 值 小 于 零 , 即 FX) 到 
f(X" ),X"* 为 极 大 值 点 ,f(X" ) 为 极 大 值 。 

由 此 可 以 得 到 结论 ,点 XX" 成 为 多 元 函数 f(X) 极 小 值 点 的 充分 条 件 是 函数 f(XX) 在 XX 点 
的 Hessian 和 矩阵 及 (XX" ) 正 定 ; 点 "成 为 极 大 值 点 的 充分 条 件 是 函数 f(XX) 在 "点 的 
Hessian 矩 阵 百 (X" ) 负 定 。 

对 于 一 般 的 优化 问题 ,大 多 已 规范 为 求 极 小 值 的 问题 , 故 可 统一 规定 无 约束 优化 问题 的 极 
值 存在 条 件 为 :VA(X* ) = 二 0,Hessian 矩阵 正定 。 

例 2-5 求 无 约束 优化 问题 f(X) 二 zi 十 zi 一 4z1 一 2zs 十 5 的 极 值 点 和 极 值 。 

解 ” 此 问题 是 无 约束 优化 问题 的 极 值 条 件 问 题 。 首 先 利用 无 约束 极 值 存在 的 必要 条 件 确 
定 驻 点 ,再 利用 其 充分 条 件 , 即 可 判定 该 驻 点 是 不 是 极 值 点 。 

(1) 利用 必要 条 件 确定 驻 点 。 
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2 1 4 
令 won=[, _,|=° 
2 
2 
求解 得 到 驻 点 XX =| |. 该 点 已 满足 极 值 存 在 的 必要 条 件 ,是 不 是 极 值 点 ,还 需要 判断 其 是 


否 满足 充分 条 件 。 ， 
(2) 利用 充分 条 件 判 断 驻 点 是 否 为 极 值 点 。 
首先 求 函数 的 Hessian 矩阵 (二 阶 偏 导数 矩阵 ) 


fi 
ax? 9X19X2 2 0 
H(X' ) 一 Vz f(X" )= =| | 
92 of 0 2 
9X29X1 arx? x=X" 


然后 判断 Hessian 和 矩阵 正定 性 。 由 于 五 (X') 的 一 阶 主子 式 |21| 二 0, 二 阶 主子 式 
| ?| = 人 >o, 四 此 H(X" ) 是 正定 的 。 


2 
所 以 ,XX 一 | ; | 是 该 无 约束 优化 问题 的 极 值 点 ,而 且 是 极 小 值 点 , 极 小 值 f(X' )=0. 


例 2-6 求 无 约束 问题 /(X) 一 地 相 十 计 恕 一 如 一 zl 的 极 值 点 ,并 判断 其 性 质 。 


解 令 vo-[ 二 | 
解 此 方程 组 可 得 到 四 个 驻 点 
w]e 
目标 函数 的 Hessian 矩阵 为 
H(X) 一 VCO 一 让 | 
将 各 驻 点 代入 ,可 知 四 个 驻 点 的 Hessian 矩阵 为 


HCX") 一 |[” _ ,| 不 定 ,不 是 极 值 点 


Hx*)=[ ?正定 ,局 部 极 小 值 点 


一 2 


HOx®)=| _， | 负 定 ,局 部 极 大 值 点 


Hx%)=| ， | 不定 ,不 是 极 值 点 


例 2-7 求 无 约束 问题 f=zt—22tz + zi +2 2rizs+ whz 二 4 的 极 值 点 ， 
并 判断 其 性 质 。 

解 令 
de 入 


V(X)= | 2 
一 2 好 十 4z2 王 22 一 此 
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解 此 方程 组 可 得 到 三 个 驻 点 
xm 到 ws ed 
3.854 1. 028 1. 4929 
12x7 = 4z; 二 2 ee 
一 让 Vy 一 2 4 


Hessian 矩阵 
HOO=Y7OO=| 


三 个 驻 点 的 Hessian 矩阵 为 


F317938 一 9.764 
五 (Xe) ) jw 1 | 正定 ,局 部 极 值 点 
HOCK)=| 。。。 “， | 正定 ,局 部 极 小 值 点 
家 一 » /HJ /Iy 局 

2 这]2 4 
0.5190 一 4. 4469 

H Xe = ~ /4\ 局 
(XY) 国生 7 | 不 定 不 是 极 值 点 


可 以 判断 ,XV 和 XX“” 均 为 局 部 极 小 值 点 ,其 对 应 极 小 值 分 别 为 FCX'” ) 王 0. 9855, ff(X”) 二 
一 0.5134。 但 由 于 /(X™) 二 fC(X”), 所 以 X” 为 全 域 极 小 值 点 ,A(X”) 王 一 0. 5134 为 全 域 极 
小 值 。 

无 约束 优化 问题 的 极 值 条 件 是 研究 优化 问题 的 基础 ;但 在 工程 上 只 有 理论 上 的 意义 。 这 
是 因为 ,实际 工程 优化 问题 的 目标 函数 比较 复杂 ,Hessian 矩阵 电 (X" ) 不 易 求解 ,其 正定 和 人 负 
定 的 判断 也 更 加 困难 。 因 此 ,无 约束 问题 的 极 值 条 件 只 作为 优化 过 程 中 的 极 小 点 判断 。 


2.3.2 约束 优化 问题 的 极 值 条 件 


对 于 约束 优化 问题 ,约束 最 优 解 是 由 最 优点 ( 极 小 点 ) 和 最 优 值 ( 极 小 值 ) 构 成 的 。 约 束 优化 问 
题 最 优 解 的 存在 有 多 种 情况 ,下 面 以 简单 的 二 维 问题 为 例 , 来 说 明 约 束 最 优 解 存在 的 几 种 情况 。 

1. 约束 最 优 解 的 存在 情况 

1) 约束 条 件 不 起 作用 

图 2-12 所 示 为 极 值 点 时" 落 在 可 行 域内 部 的 一 种 情况 。 可 行 域 9 为 凸 集 ,目标 函数 (X) 
为 凸 函数 , 且 有 VACX" ) 二 0, H(X" ) 正 定 , 极 值 点 X" E 9。 此 时 ,所 有 约束 条 件 对 最 优点 XX* 
都 不 起 作用 。 所 以 ,约束 优化 问题 就 等 价 于 无 约束 优化 问题 ,目标 函数 的 极 值 点 就 是 该 约束 优 
化 问题 的 极 小 点 。 





图 2-12 约束 不 起 作用 图 2-13 等 式 约束 起 作用 


2) 等 式 约 束 起 作用 
图 2-13 所 示 为 在 满足 不 等 式 约束 的 条 件 下 , 极 值 点 XX 落 在 等 式 约束 h(X) 与 目标 函数 
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了 (X) 等 值 线 的 切 点 上 (或 等 式 约束 与 约束 边界 的 交点 )。 此 时 , 仅 有 等 式 约束 对 最 优点 XX" 起 
作用 ,不 等 式 约束 条 件 对 最 优点 XX" 不 起 作用 。 

3) 一 个 约束 起 作用 

图 2-14 所 示 为 约束 最 优点 X 落 在 约束 边界 gz (X) 与 目标 函数 f(X) 等 值 线 的 切 点 上 。 
此 时 ,gz(X) 二 0 为 起 作用 约束 ,而 g1(X) 二 0、gs(X) 二 0 为 不 起 作用 约束 ,目标 函数 的 无 约束 
极 值 点 在 可 行 域外 。 

4) 两 个 或 两 个 以 上 约束 起 作用 

图 2-15 所 示 为 约束 最 优点 X" 落 在 两 约束 边界 g1(X) ,gs(X) 与 目标 函数 /(XX) 等 值 线 的 
交点 上 。 此 时 ,gi (XX) 二 0、gs(X) 二 0 为 起 作用 约束 ,而 g;(X) 二 0 为 不 起 作用 约束 .目标 孙 数 
的 无 约束 极 值 点 在 可 行 域外 。 这 种 情况 下 起 作用 约束 一 般 为 两 个 或 两 个 以 上 。 





图 2-14 一 个 约束 起 作用 图 2-15 两 个 或 两 个 以 上 约束 起 作用 


5) 约束 函数 为 凸 函 数 ,目标 函数 为 非 凸 函数 

图 2-16 所 示 可 行 域 2 为 凸 集 , 目 标 函数 /(X) 为 非 凸 函数 ,而 约束 函数 g(X) 是 凸 函 数 ， 
则 可 能 有 多 个 最 优点 ( 见 图 2-16 中 的 X 和 X" 2 ) ,但 只 有 一 个 点 为 全 局 最 优点 。 

6) 约束 函数 为 非 凸 函数 

图 2-17 所 示 目 标 函 数 f(X) 是 凸 函数 ,而 起 作用 约束 8(X) 是 非 凸 函数 , 则 也 有 可 能 会 产 
生 多 个 最 优点 ( 见 图 2-17 中 的 XXX 和 ), 但 只 有 一 个 为 全 局 最 优点 ,其 余 为 局 部 
最 优点 。 





图 2-16 约束 函数 为 凸 函数 ,目标 函数 为 非 凸 函数 图 2-17 约束 函数 为 非 凸 函数 


以 上 分 门 别 类 地 介绍 了 二 维 约 束 优化 问题 条 件 极 值 ( 约 束 极 值 ) 存 在 的 几 种 情况 , 它 同样 
适用 于 多 维 约束 优化 问题 。 

由 此 可 见 , 约 束 问题 最 优 解 的 存在 情况 可 能 有 两 种 :一 是 极 值 点 在 可 行 域内 部 , 即 极 值 点 
是 可 行 域 的 内 点 ,这 种 情况 的 约束 优化 问题 等 价 于 无 约束 优化 问题 ; 男 一 种 情况 的 最 优点 是 等 
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值 线 ( 面 ) 与 起 作用 约束 线 ( 面 ) 的 切 点 ,或 者 是 多 个 起 作用 约束 的 交点 。 对 于 目标 函数 是 凸 函 
数 , 可 行 域 是 凸 集 的 凸 规划 问题 ,局 部 极 值 点 与 全 局 极 值 点 重合 ,因此 凸 规划 问题 有 唯一 的 约 
束 极 值 点 ;而 非 凸 规划 问题 有 多 个 约束 极 值 点 。 但 在 实际 问题 中 ,可 能 是 以 上 几 种 情况 的 综 
合 , 所 以 要 具体 问题 具体 分 析 。 

2. 约束 极 值 存 在 的 必要 条 件 

约束 优化 问题 的 极 值 条 件 比 无 约束 优化 问题 要 复杂 得 多 。 一 般 来 说 ,我 们 在 研究 约束 优 
化 问题 时 ,主要 解决 两 个 方面 的 问题 。 

(1) 判断 约束 极 值 点 存在 的 必要 条 件 。 

(2) 判断 所 得 极 值 点 是 全 域 最 小 点 或 是 局 部 最 小 点 。 

这 里 只 是 讨论 第 一 个 问题 ,至 于 第 二 个 问题 到 目前 为 止 还 没有 统一 的 结论 。 也 就 是 说 ,这 
里 所 给 出 的 必要 条 件 只 是 局 部 最 优 解 的 必要 条 件 。 

1) 下 降 方向 .可行 方向 和 可 行 下 降 方向 

(1) 下 降 方 向 。 

优化 过 程 中 ,只 要 能 使 目标 函数 值 减 小 的 方向 均 称 为 下 降 方向 。 如 图 2-18 所 示 , 等 值 线 
为 二 维 优化 目标 函数 A(X) 二 a ,cs，…ycs 时 的 等 值 线 ,VA(X) 为 /(XX) 在 设计 点 X" 处 的 梯度 
方向 。 


g(X)<0 
g(X)=0 
g(X)>0 





图 2-18 下 降 方 向 区 图 2-19 可 行 方 向 区 


由 梯度 的 定义 可 知 ,梯度 方向 VA(X) 是 目标 函数 等 值 线 ( 面 ) 的 法 线 方向 ,所 以 沿 与 
一 VA(X) 夹 角 为 锐角 的 方向 S 取 点 ,都 能 使 目标 函数 值 减 小 。 由 此 可 见 , 下 降 方向 S 与 目标 函 
数 jX) 的 负 梯 度 方 向 (一 VFCX) ) 的 夹 角 应 为 锐角 。 即 

S. (一 VF(X))>0 或 S.VFCX) 一 0 (2-11) 

这 样 ,下 降 方向 就 位 于 负 梯 度 方向 (一 VA(X)) 与 等 值 线 切线 所 围 成 的 扇形 区 域内 ,如 图 
2-18 所 示 的 阴影 区 域 。 可 以 看 到 ,在 角度 为 上 的 扇形 区 域内 确定 的 8 方向 一 定 是 下 降 方向 。 

(2) 可 行 方向 。 

从 约束 边界 出 发 的 所 有 方向 有 两 种 ,一 种 称 为 可 行 方向 , 另 一 种 是 不 可 行 方向 。 可 行 方向 
可 认为 是 由 约束 边界 出 发 ,指向 可 行 域 内 的 任何 方向 , 即 不 破坏 约束 条 件 的 方向 。 可 行 域内 的 
任何 方向 均 为 可 行 方向 。 

如 图 2-19 所 示 ,假设 g(XX) 是 起 作用 约束 边界 , 它 将 设计 空间 分 为 两 部 分 ,g (XX) 二 0 侧 为 
可 行 域 ,g(X) 二 0 侧 为 非 可 行 域 ,g(X) 二 0 为 约束 边界 。W (XI) 为 约束 边界 g(X) 二 0 上 设计 
点 对 2 的 约束 梯度 方向 。 当 约束 边界 取 g(X) 志 0 形式 时 ,约束 函数 的 梯度 (法 线 ) 方 向 总 是 由 
约束 边界 指向 非 可 行 域 一 侧 。 方 向 S$ 是 可 行 方向 , 它 与 约束 梯度 方向 Ve (X) 的 夹 角 应 为 钝 
角 。 即 
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$+ W(X)=0 (2-12) 
也 可 写 为 
—[Ve(X)]'S>0 
由 图 2-19 可 看 出 ,可 行 方向 应 位 于 约束 负 梯 度 方 向 (一 下 (XX)) 与 其 切线 方向 所 围 成 的 扇 
形 区 域内 (阴影 区 域 ) ,在 角度 为 的 扇形 区 域内 确定 的 S 方向 一 定 是 可 行 方向 。 
(3) 可 行 下 降 方向 。 
可 行 下 降 方向 包含 了 可 行 方向 和 下 降 方向 的 所 有 特征 , 即 在 不 破坏 约束 的 条 件 下 ,使 目标 
函数 值 下降 的 方向 。 所 以 ,可 行 下 降 方向 需 同 时 满足 式 (2-11) 和 式 (2-12) , 联 立 两 式 有 
一 VCX)。S>0 
W(X). $<0 
如 图 2-20(a) 所 示 , 一 VA(X) 为 目标 函数 等 值 线 在 设计 点 X” 的 负 梯 度 方向 ,We(X) 为 约束 
边界 g(X) 在 六 “的 梯度 方向 ,指向 非 可 行 域 。 根 据 可 行 下 降 方向 的 定义 ,目标 函数 f(X) 等 值 
线 在 和 X” 处 的 切线 与 约束 边界 g(X) 在 X” 处 的 切线 所 夹 角度 的 扇形 区 域内 的 所 有 方向 都 
是 可 行 下 降 方向 。 


(2-13) 








-Vgz (XW) f( 义 ) 等 值 线 在 外 处 切 平面 


gz( 半 ) 在 义 中 处 切 平面 
-vf/( X®) 


(a) (b) 


图 2-20 可 行 下 降 方向 区 
(a) 约束 边界 上 的 可 行 下 降 方向 (b) 约束 边界 交点 的 可 行 下 降 方向 

图 2-20(b) 所 示 为 在 两 约束 函数 gi (XX) 和 g;(X) 的 交点 X2 处 的 可 行 下 降 方向 。 由 图 中 
可 以 看 出 ,要 满足 可 行 下 降 方向 的 所 有 条 件 ,可行 下 降 方向 必 处 于 各 可 行 方向 区 和 下 降 方向 区 
的 交集 , 即 阴影 所 示 的 夹 角 为 上 的 扇形 区 域内 。 

2) 一 个 约束 起 作用 时 极 值 点 存在 的 必要 
条 件 

对 于 约束 优化 问题 ,无 约束 极 值 点 位 于 可 行 
域外 ,约束 起 作用 的 方式 如 图 2-21 所 示 。 

在 约束 边界 上 有 方向 $ 存在 , 且 S 满足 式 
(2-13), 即 总 存在 可 行 下 降 方向 , 则 该 点 就 不 是 极 
值 点 。 当 且 仅 当 


ga(X) 







5 此 点 找 不 到 可 
。/ 行 下 降 方向 






Ve(X) -W(X) 
-YA(X ) 
一 VFCX) | g(X) Ve(X ) 


时 ,不 存在 可 行 下 降 方向 , 则 使 这 一 条 件 成 立 的 点 图 2-21 一 个 约束 起 作用 的 情况 
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即 为 所 求 的 约束 极 值 点 , 它 是 目标 函数 的 等 值 线 与 起 作用 约束 的 切 点 ,如 图 2-21 中 的 点 XX* 
(在 点 站 "的 约束 边界 与 目标 函数 的 两 梯度 方向 完全 重合 )。 
因此 ,一 个 约束 起 作用 时 ,约束 极 值 点 存在 的 必要 条 件 可 写 为 
VI(X)=—AVg(X) 4>0 (2-14) 
3) 两 个 约束 起 作用 时 极 值 点 存在 的 必要 条 件 
如 图 2-22 所 示 ,假设 点 了 “处 于 约束 线 的 交点 上 ,该 点 的 目标 函数 A(X) 的 负 梯 度 方向 为 
一 VACX"” ) ,两 个 起 作用 约束 的 梯度 方向 分 别 为 We1 CX")、Ves (X*)。 若 在 XX 点 找到 一 个 方 
向 $ 使 它 满足 下 列 三 个 不 等 式 : 
一 V(X )。S>0 保证 下 降 性 
Wi(CX2 )。S< 一 0 保证 可 行 性 
VWez(X*)。S<0 保证 可 行 性 
则 S 方向 为 可 行 下 降 方向 。 所 以 说 于 ”为 非 极 值 点 ( 非 稳定 点 ); 反 之 ,如 破坏 上 述 三 个 条 件 中 
的 任何 一 个 ,或 者 说 在 XX” 点 找 不 到 可 行 下 降 方向 , 则 X ”就 成 为 极 值 点 (稳定 点 ), 如 图 2-23 
中 的 半点 。 


gs(X)=0 





Ve gaz) RX) 


图 2-22 存在 可 行 下 降 方 向 图 2-23 不 存在 可 行 下 降 方向 


实践 证 明 ,对 于 两 个 约束 起 作用 的 问题 ,只 有 当 约 束 交 叉 点 X“ 处 的 目标 函数 的 负 梯 度 方 
向 一 VACX"* ) 位 于 两 个 约束 函数 的 梯度 方向 Ve1(X”)、Ves(X”) 所 夹 的 扇形 区 域内 时 ,上 述 三 
个 条 件 才 不 能 同时 成 立 , 即 不 存在 可 行 下 降 方 向 S$, 则 该 点 就 为 两 个 约束 起 作用 时 的 约束 极 
值 点 。 

如 果 记 两 个 约束 的 交叉 点 为 约束 极 值 点 , 则 在 该 点 必 有 目标 函数 的 负 梯 度 方向 位 于 两 个 
约束 梯度 方向 所 夹 扇 形 区 域内 。 由 于 一 WX" ) 位 于 Ve1(X”)、Ves (XW ) 的 夹 角 内 ,由 矢量 求 
和 的 平行 四 边 形 法 则 有 

—VXH)=A We (XH) HA WKLY NS0,N>0) (2-15) 

成 立 。 
式 (2-15) 就 是 两 个 约束 起 作用 时 约束 极 值 点 存在 的 必要 条 件 。 该 条 件 也 可 表示 为 

VT)=— Nh Wh WX) i>0N>0) (2-16) 
4) 约束 极 值 点 存在 的 必要 条 件 一 一 K-T 条件 
由 一 个 约束 起 作用 及 两 个 约束 起 作用 的 结论 ,也 同样 可 以 得 到 多 个 约束 起 作用 的 结论 ,由 此 
归纳 出 一 般 情 况 下 约束 极 值 点 存在 的 必要 条 件 , 即 Kuhn-Tucker 条 件 。 它 是 由 Kuhn、 Tucker 
提出 的 ,简称 K-T 条件。 
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如 果 居 ”为 约束 极 值 点 , 则 该 点 的 目标 函数 的 梯度 可 以 表示 为 各 起 作用 约束 函数 的 梯度 
的 线性 组 合 。 其 数学 表达 式 为 


9 
WK) =— A Wai (XP) 一 入 Wa XT) — A Vg KP) =— DN VeX®) 
i=] 


(2=17) 

式 中 :Ai>0 是 常数 ;i 二 1,2,…,g 为 起 作用 约束 个 数 。 

满足 K-T 条 件 的 点 称 为 K-T 点 。 用 优化 术语 讲 ,K-T 点 为 无 可 行 下 降 方 向 的 设计 点 ( 约 
束 极 值 点 ) ;从 几何 角度 讲 ,K-T 点 有 以 下 几何 特征 : 

(1) 一 个 约束 起 作用 的 K-T 点 的 特征 为 :一 V(X ) | g(X™); 

(2) 两 个 约束 起 作用 的 K-T 点 的 特征 为 :一 W(X ) 位 于 We (X*”)、Ves(X*) 所 夹 的 扇形 
区 域内 ; 

(3) 三 个 以 上 约束 起 作用 的 K-T 点 的 特征 为 :一 VA(X* ) 位 于 所 有 起 作用 约束 的 梯度 方 
向 在 设计 空间 所 构成 的 多 棱锥 体内 。 

5) 关于 K-T 条 件 应 用 的 几 点 说 明 

(1) K-T 条件 是 约束 极 值 存在 的 必要 条 件 。 必 要 条 件 是 起 否定 作用 的 ,因此 K-T 条 件 主 
要 用 于 判定 所 得 最 优点 是 否 为 约束 最 优点 。 

(2) 对 目标 函数 或 约束 函数 为 非 凸 的 优化 问题 ( 非 凸 规划 问题 ), K-T 条 件 可 能 是 局 部 极 
小 点 ;对 目标 函数 和 可 行 域 全 凸 的 优化 问题 ( 凸 规划 问题 ) ,K-T 点 为 全 域 最 小 点 , 即 此 时 K-T 


条 件 成 为 约束 极 值 存在 的 充 要 条 件 。 
(3) 约束 函数 表达 式 不 同 ,K-T 条 件 的 表达 式 有 变 。 建 议 运 用 K-T 条 件 时 , 先 将 约束 条 
件 处 理 为 g(X)<0 形式 。 
(4) 对 于 同时 存在 等 式 约束 和 不 等 式 约束 条 件 的 情况 ,K-T 条 件 采用 以 下 形式 
一 WCGXw) = > 下.(XX) 十 2 i. (2-18) 


式 中 :X 宇 0 是 常数 ( 非 负 ) ;uj 不 全 为 0( 并 没有 非 负 要 求 )。 
例 2-8 用 K-T 条 件 判 断 = 二 [1 1 1]" 是 不 是 下 列 约束 优化 问题 的 最 优 解 。 
minf(X)=—3x? 二 xz? 十 2x3 
s. t. g1(¥X)=Zxi—Zxs0 
ks (X= — SAO 
g3(X)=—xz<0 
g4 (X) 一 一 Zz 委 0 
gs5(X) 一 一 Z 委 0 
解 ”要 利用 K-T 条 件 判 断 设计 点 是 不 是 约束 优化 问题 的 最 优 解 ,首先 要 判断 哪些 约束 条 
件 是 起 作用 约束 。 判 断 某 个 约束 条 件 是 不 是 起 作用 约束 ,可 将 设计 点 X" 代入 该 约束 条 件 。 
若 g;:(X" ) 二 0, 则 约束 条 件 g;(X" )<0 是 起 作用 约束 ; 若 g;(X* ) 关 0, 则 约束 条 件 g;(X" ) 委 0 
是 不 起 作用 约束 ,在 运用 K-T 条 件 时 不 予 考虑 。 
因此 ,将 点 XX = 二 [Ll1 1 1] 代入 各 约束 函数 后 判断 可 知 ,约束 条 件 g1(X) 和 g;(X) 为 起 
作用 约束 。 
0x 
VA(X” -| 27x2 


423 








[1,1,1] 
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1 

we 

0 
22Z1 2 
war | . -| | 
一 多 xfri 1 避 = 人 


将 VFCX' ) .Ve1(X*) 和 W(X* ) 代 入 开 - 工 条 件 , 得 
一 站 1 2 
:| = 区 十 A | 
4 0 一 光 


1 一 2， 2 一 2 











解 方程 组 可 得 


由 于 三 2 盖 0, 王 2>>0, 满 足 K-T 条 件 , 故 X =[L1 1 1]7 是 该 约束 优化 问题 的 最 


优 解 。 
从 例 2-8 可 归纳 出 运用 K-T 条 件 的 一 般 步骤 : 
(1) 判断 起 作用 约束 ; 
(2) 计算 目标 函数 梯度 VA(X* ) 和 起 作用 约束 梯度 W;(X* ); 
(3) 代入 K-T 条件, 判断 4; 宇 0? 若 满足 , 则 X" 为 约束 极 值 点 。 
例 2-9 用 K-T 条 件 求解 等 式 约束 问题 
rs 
st. 九 (X) 一 Zi 十 zs 一 4 一 0 
的 最 优 解 。 
解 将 
vw | 


2z2 


1 
vaoo=| | 


sg | 
2 Ww 
27y 1 


代入 K-T 条件 式 (2-18) ,可 得 


解 方程 组 可 得 
= 二 
mm 
将 zx! 和 zs 的 表达 式 代 入 等 式 约束 h(XX) 二 0 ,求解 后 得 
ui 二 一 1 


将 刀 代入 zi 和 xz; 的 表达 式 , 得 到 
X=[7/2 1/2J 
即 为 等 式 约束 优化 问题 的 最 优 解 。 
对 于 如 例 2-9 所 示 的 仅 包 含 等 式 约束 条 件 的 约束 优化 问题 
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min /(X) XER" 
Bs h,(X)=0 v=1,2,°",p 
也 可 通过 建立 拉 格 朗 日 函数 来 进行 求解 。 拉 格 朗 日 函数 可 写成 


p 
L(X,w) = /CX) 十 Dwh,(X) (2-19) 
j=] 
利用 极 值 存在 条 件 ; 令 
VL(X' ,u)=0 
整理 后 ,得 
， 
一 WX) = 二 > 四 VACXO) (w 不 全 为 0) (2-20) 
J 一 


很 明显 , 式 (2-20) 与 前 述 的 K-T 条 件 完全 一 致 。 因 此 ,对 例 2-9 通过 建立 拉 格 朗 日 函数 
的 方法 求解 。 





建立 拉 格 朗 日 函数 
p 
LOX,u) = fCX) 十 Duhs(X) = Cri —3) 二 十 u(xr 二 zi 一 4) 
j=1 
令 
9 ty Ew 
Zi 
aL 
3 一 2zz 十 x=0 
=z1+zs—4=0 
求解 方程 组 可 得 
| 2 日 Xs2 2 





将 zk 和 zs 代入 上 面 方程 组 的 第 三 式 , 得 
& 王 一 】 


故 等 式 约束 优化 问题 的 最 优 解 X" 二 [7/2 ”1/2J" 。 两 种 解法 结果 是 一 致 的 。 


2.4 优化 过 程 


2.4.1 优化 问题 的 图 解 


为 有 助 于 建立 优化 设计 的 基本 概念 ,增加 感性 认识 , 现 将 有 关 设 计 变 量 、 目 标 函 数 及 约束 
条 件 最 优 解 ( 最 小 点 X" ,最 小 值 /A(X* )) 之 间 的 关系 用 几何 图 形 予 以 描述 。 
假设 给 定 优化 设计 问题 
minf(X)=zxi?++zxi—4z 二 4= (zi—2)’ 二 xz? 
$s. t. Bi(X)=—N +++z—2<0 
gs(X)=zxi—Zz;+1<0 
ga3(X)=—Zzi10 
这 是 一 个 二 维 约束 非 线 性 优化 的 设计 间 题 。 先 确定 其 设计 空间 ,再 考查 其 目标 函数 
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f(X),. 显 然 ,我 们 可 以 在 三 维 空间 内 绘 出 目标 函数 的 几 
何 图 形 ( 见 图 2-8), 它 为 一 上 四 (下 凸 ) 的 旋转 抛物 面 ， 
抛物 面 的 项 点 位 于 = [zi zz =[2 0j' ,此 点 的 函 
数值 f(X) 二 0, 如 图 2-24 所 示 。 

如 果 不 考 虑 约束 条 件 , 即 求 /A(X) 的 无 约束 极 小 值 ， 
则 旋转 抛物 面 的 顶点 X= 王 [2 0J" 为 极 小 值 点 , 极 小 值 
为 f(X" ) 二 0。 一般 来 说 ,无 约束 优化 问题 的 极 值 点 处 
于 目标 函数 等 值 线 的 中 心 , 称 为 自然 极 值 点 。 

如 果 考 虑 约束 条 件 ,在 二 维 设计 空间 内 ,各 约束 线 
确定 一 个 约束 可 行 域 。 画 出 目标 函数 的 一 簇 等 值 线 , 如 
2-24 所 示 , 它 是 以 顶点 (2,0) 为 圆心 的 一 簇 同心 圆 。 

f(X)=9 根据 等 值 线 与 可 行 域 的 相互 关系 ,在 约束 可 行 域内 寻找 
图 2-24 图 解法 目标 函数 的 极 小 值 点 的 位 置 。 显 然 ,约束 最 优点 为 约束 
边界 与 目标 函数 等 值 线 的 切 点 (起 作用 约束 ) ,约束 极 值 
点 六 "= 二 [0.58 1.34]' ,最 优 值 为 /(X* ) 一 3. 812。 

图 解法 只 适用 于 一 些 简单 的 优化 问题 。 对 于 二 2 的 约束 优化 问题 ,就 难以 进行 直观 的 几 
何 描述 ,但 可 以 这 样 理解 n 维 约束 优化 问题 :在 个 设计 变量 所 构成 的 设计 空间 内 ,由 mx 个 不 
等 式 约束 超 曲 面 组 成 一 个 可 行 域 9, 优 化 的 任务 即 是 在 9 内 找 出 目标 函数 值 最 小 的 点 。 对 于 
约束 优化 问题 来 说 ,最 小 点 一 定 落 在 某 个 约束 边界 上 ,是 该 约束 边界 与 目标 函数 等 值 超 曲面 的 
切 点 。 


2.4.2 优化 设计 的 步骤 


用 优化 设计 方法 解决 工程 问题 大 体 需 进行 下 列 四 大 步骤 。 

(1) 建立 数学 模型 :将 工程 问题 的 设计 参数 .设计 目标 .设计 要 求 用 数学 公式 表达 出 来 。 

(2) 选用 适当 的 优化 方法 :依据 是 优化 问题 的 性 质 及 目标 函数 约束 函数 的 性 态 , 约 束 、 无 
约束 ,线性 , 非 线性 ,离散 或 连续 ,设计 变量 的 个 数 等 。 要 求 对 优化 方法 有 透彻 的 了 解 ,不同 的 
优化 方法 适 于 解决 何 种 类 型 的 问题 。 

(3) 编写 程序 ,上 机 运算 ,直至 求 得 最 优 解 。 

(4) 对 输出 结果 进行 分 析 判 断 ,如 不 满足 工程 设计 要 求 , 则 应 对 以 上 三 步 进 行 检查 或 修 
正 , 以 期 得 到 理想 结果 。 


2.4.3 ”优化 问题 的 迭代 算法 与 终止 准则 


以 上 各 节 从 理论 上 探讨 了 无 约束 优化 问题 及 约束 优化 问题 的 最 优 解 的 求法 及 最 优 解 存在 
的 条 件 。 它 提供 了 解析 法 寻 优 的 手段 ,同时 也 为 构造 优化 方法 、 分 析 寻 优 过 程 中 出 现 的 问题 提 
供 了 理论 依据 。 但 由 于 实际 工程 优化 问题 中 ,目标 函数 及 约束 函数 大 多 都 是 非 线性 的 ,有 时 对 
它们 进行 解析 ( 求 导 ) 运 算是 十 分 困难 的 ,甚至 是 不 可 能 的 ,所 以 在 实践 中 仅 能 解决 小 型 和 简单 
的 问题 ,对 于 大 多 数 工程 实际 问题 是 无 能 为 力 的 。 随 着 电子 计算 机 技术 的 发 展 ,为 优化 设计 提 
供 了 另 一 寻 优 途径 一 一 数值 迭代 法 , 它 是 优化 设计 问题 的 基本 解法 ,是 真正 实用 的 寻 优 手段 。 

1. 数值 迭代 法 

数值 迭代 法 是 一 种 近似 的 优化 算法 , 它 是 根据 目标 函数 的 变化 规律 ,以 适当 的 步 长 沿 着 能 
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使 目标 函数 值 下 降 的 方向 ,逐步 向 目标 函数 值 的 最 优 
点 进行 探索 ,最 终 允 近 到 目标 函数 的 最 优点 或 直至 达 
到 最 优点 。 

下 面 以 二 维 优化 问题 为 例 来 说 明 数 值 迭代 法 的 
基本 思想 。 如 图 2-25 所 示 , 首先 选择 一 个 初始 点 
X' ,从 XW" 出 发 ,按照 某 种 方法 确定 一 个 使 目标 函数 
值 下 降 的 可 行 方向 , 沿 该 方向 走 一 定 的 步 长 mo ,得 到 
一 个 新 的 设计 点 X,X 与 X 的 函数 值 应 满足 下 
降 关 系 

at Si i A eh 
然后 ,再 以 为 出 发 点 ,采用 相同 的 方法 ,得 到 第 二 
个 点 XX” 3 重复 以 上 步骤 ,依次 得 到 点 XY ,XX ，…， 
X"” ,直至 得 到 一 个 近似 最 优点 X” , 它 与 理论 最 优点 图 2-25 ”数值 迭代 过 程 
的 近似 程度 应 满足 一 定 的 精度 要 求 。 

形象 地 说 ,数值 迭代 法 的 基本 思想 就 是 “ 睹 子 下 山 法 ”, 由 一 点 X* 出 发 , 先 找 出 一 个 使 目标 
函数 值 下 降 最 快 的 方向 $S” ,再 沿 S” 方 向 搜索 , 找 出 使 目标 函数 值 达到 最 小 所 走 的 最 优 步 长 w 。 

2. 数值 迭代 法 的 迭代 格式 

为 了 优化 过 程 的 顺利 进行 及 便于 计算 机 编程 ,通常 选用 一 种 适用 于 反复 计算 的 迭代 格式 

KutD OS k=0 ls (2-21) 
式 中 :X“? 为 第 次 迭代 所 得 的 新 设计 点 (终点 ), 也 是 下 一 次 (& 十 1 次 ) 迁 代 的 出 发 点 ;第 一 
次 迭代 时 ,X**? 二 XX ;X* 为 第 次 迭代 的 出 发 点 ,也 是 上 一 次 (4 一 1 次) 和 迭代 所 得 的 终点 ; 
初始 迭代 (k= 二 0) 时 ,XX 二 XX 5S ”为 第 & 次 迭代 的 搜索 方向 ( 寻 优 方向 );ax 为 第 & 次 迭代 的 
搜索 步 长 (或 称 步 长 因子 .最 优 步 长 等 ) 。 

在 一 系列 的 迭代 过 程 中 ,各 迭代 点 的 目标 函数 值 应 满足 如 下 的 递减 关系 

WS. lb i, Gp p> sb. Di. Sb 
且 {X® k=0,1,2,.…}E9, 

从 和 迭代 格式 (2-21) 中 可 以 看 出 ,迭代 法 的 中 心 问题 是 求 步 长 因子 w 及 最 优 方向 S” 。 只 
要 步 长 w 和 搜索 方向 S$“ 确定 ,近代 过 程 就 可 以 一 直 延 续 下 去 。 由 此 可 知 , 实 用 的 优化 方法 的 
主要 研究 内 容 包 括 三 个 方面 : 

(1) 如 何 选 取 初 始点 X” 对 迭代 过 程 最 为 有 利 ; 

(2) 如 何 选取 寻 优 方向 $S” 使 目标 函数 值 下 降 最 快 ; 

(3) 如 何 选取 步 长 因子 w 。 

3. 数值 迭代 法 的 终止 准则 

从 理论 上 说 ,任何 一 种 迭代 法 都 可 以 产生 无 穷 的 点 序列 {X” 上 & 二 1,2,*…,n) ,而 且 只 要 
迭代 是 收敛 的 , 当 有 >co 时 ,应 有 “一 X" , 即 lim 咏 二 X"。 而 在 实际 优化 过 程 中 ,不 可 能 也 
不 必要 和 迭代 无 穷 多 次 ,只 要 迭代 点 在 满足 一 定 精度 条 件 下 接近 最 优点 便 可 终止 迭代 。 同 时 注 
意 到 ,在 迭代 寻 优 过 程 中 , 极 值 点 X" 也 是 未 知 的 ,因此 只 能 借助 于 相 邻 两 个 迭代 点 的 误差 来 
代替 迭代 点 与 极 值 点 的 误差 。 

判断 搜索 过 程 中 的 迭代 点 与 极 值 点 近似 程度 的 方法 称 为 终止 准则 。 终 止 准 则 通常 有 以 下 
三 种 : 
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(1) 迭代 点 的 梯度 的 模 充 分 小 。 
根据 前 述 可 知 , 无 约束 极 值 点 的 必要 条 件 为 V(X* )= 二 0, 则 当 


| VX = ee SE (2-22) 


可 认为 X" 二 XX”。 此 准则 适用 于 无 约束 优化 问题 。 
(2) 相 邻 迭代 点 之 间 的 距离 充分 小 。 
相 邻 两 个 迭代 点 之 间 的 距离 小 于 给 定 精度 , 当 





=| (2-23) 
1 


此 时 不 存在 可 行 下 降 方向 ,可 认为 XX" 二 XX。 
(3) 相 邻 两 个 迭代 点 的 目标 函数 值 的 下 降 量 或 相对 下 降 量 充分 小 








当 
| ACRE TR) Res (2-24) 
或 
(十 1)N (hk) 
A <e, (2-25) 
可 认为 X" 一 大 人。 


以 上 各 式 中 的 @ ,es ,es ,es 是 具有 不 同 物理 意义 的 精度 值 ,可 根据 工程 实际 问题 对 精度 的 
要 求 及 和 迭代 方法 而 定 。 这 三 种 准则 都 在 一 定 程 度 上 ,从 不 同 侧面 反映 了 达到 最 优点 的 程度 ,但 
大 都 有 一 定 的 局 限 性 。 采 用 哪 种 终止 准则 ,可 视 具 体 情 况 而 定 。 在 实际 应 用 中 , 常 将 一 个 或 多 
个 终止 准则 同时 使 用 ,以 确保 所 得 的 最 优 解 的 可 靠 性 。 


2.5 优化 方法 分 类 


优化 方法 ,也 可 称 为 优化 算法 或 寻 优 方法 ,是 求解 各 类 优化 问题 的 数值 迭代 算法 ,种 类 繁 
多 。 考 虑 问题 的 侧重 点 不 同 , 分 类 方法 也 不 同 。 不 同类 型 的 优化 设计 问题 可 以 有 不 同 的 优化 
方法 ,即使 同一 类 型 的 优化 问题 ,也 可 能 有 多 种 优化 方法 。 反 之 , 某 些 优化 方法 可 适用 于 不 同 
类 型 优化 问题 的 数学 模型 求解 。 

根据 优化 设计 数学 模型 中 目标 函数 与 约束 函数 的 性 态 , 可 将 传统 优化 方法 分 为 线性 优化 
方法 和 非 线 性 优化 方法 。 当 目标 函数 和 约束 函数 均 为 线性 函数 时 , 称 为 线性 优化 ;线性 优化 多 
用 于 生产 组 织 和 管理 问题 的 优化 求解 ,单纯 形 法 是 线性 优化 中 应 用 最 广 的 方法 之 一 。 如 果 目 
标 函 数 和 约束 函数 中 至 少 有 一 个 非 线 性 函数 , 即 为 非 线 性 优化 。 非 线性 优化 方法 是 解决 工程 
设计 实际 问题 的 最 为 常用 的 优化 方法 。 

根据 设计 空间 的 维 数 或 设计 变量 的 数目 ,将 优化 方法 分 为 一 维 优化 和 多 维 优化 。 一 维 优化 
方法 是 优化 方法 中 最 简单 .最 基本 的 方法 ,有 黄金 分 割 法 (0. 618 法 ) .二 次 插值 法 等 ,它们 是 多 维 
优化 方法 的 基础 。 另 外 ,根据 设计 变量 的 性 质 不 同 , 可 分 为 离散 变量 优化 和 连续 变量 优化 等 。 

根据 数学 模型 中 有 无 约束 条 件 , 将 优化 方法 分 为 无 约束 优化 方法 和 约束 优化 方法 。 无 约 
束 优化 方法 主要 包括 梯度 法 (最 速 下 降 法 )、 牛 顿 法 、 变 尺度 法 、 共 轿 梯 度 法 、 坐 标 轮换 法 、 
Powell 法 等 ;约束 优化 方法 主要 包括 复合 形 法 .可行 方 向 法 、 拉 格 朗 日 乘 子 法 、 惩 罚 函 数 法 . 序 
列 线性 规划 法 等 。 
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根据 优化 方法 的 求解 特点 ,还 有 直接 法 和 间接 法 之 分 。 直 接 法 就 是 利用 迭代 过 程 已 有 的 
信息 和 再 生 信息 进行 寻 优 ,不 需要 对 函数 求 导 等 解析 计算 , 像 坐标 轮换 法 ,Powell 法 、 复 合 形 
法 .可行 方向 法 等 都 属于 直接 法 ;间接 法 就 是 在 优化 过 程 中 利用 函数 的 性 态 , 通 过 微分 或 变 分 
寻 优 ,或 者 将 原 约束 优化 问题 等 效 转 化 为 线性 规划 类 ,无 约束 优化 类 或 二 次 规划 类 等 相对 简单 
的 优化 问题 进行 求解 , 像 梯 度 法 、 牛 顿 法 、 变 尺度 法 、 共 轿 梯 度 法 、 拉 格 朗 日 乘 子 法 、 惩 罚 函 数 
法 .序列 线性 规划 法 等 都 是 间接 优化 方法 。 

对 于 线性 约束 优化 问题 和 无 约束 优化 问题 的 优化 方法 ,在 理论 上 和 方法 实现 上 已 经 非常 
成 熟 , 它 们 也 是 求解 非 线性 优化 问题 的 基础 。 由 于 非 线性 约束 优化 设计 间 题 的 目标 函数 或 约 
束 条 件 中 存在 设计 变量 的 非 线 性 函数 ,尽管 优化 方法 也 有 许多 ,但 是 仍 需 要 在 计算 效率 等 多 个 
方面 继续 完善 。 

从 工程 应 用 角度 出 发 ,人 们 陆续 提出 了 与 传统 优化 方法 显著 不 同 的 现代 优化 方法 (或 
称 为 智能 优化 方法 ) ,如 神经 网 络 优化 方法 、 遗 传 算 法 模拟 退火 算法 、 蚁 群 算法 及 和 谐 搜索 
算法 等 。 这 些 优 化 方法 的 出 发 点 是 要 尽 可 能 找到 复杂 优化 问题 的 全 局 最 优 解 。 特 别 是 模 
拟 退 火 算法 和 遗传 算法 ,对 模型 的 数学 性 态 没有 特殊 要 求 , 具 有 广阔 的 应 用 领域 ,是 目前 智 
能 优化 方法 的 主要 研究 内 容 ,并 已 成 为 寻找 上 述 困 难 优 化 问题 近似 全 局 最 优 解 的 主要 方 
法 。 和 声 搜索 算法 概念 清晰 简单 ,算法 参数 少 ,收敛 性 好 ,被 用 于 解决 建筑 土木 ,城市 规划 
等 学 科 的 优化 问题 。 


习 题 


2-1 某 农场 有 甲 、 乙 \ 丙 三 块 试验 田 , 分 别 为 200 公顷 .400 公顷 和 500 公顷 ,计划 种 植 A、B、C 
三 种 农作物 。 已 知 A、B\C 每 公顷 的 种 植 成 本 分 别 为 3000 元 .2500 元 和 1000 元 ,三 种 农 
作物 的 产量 如 题 2-1 表 所 示 ( 单 位 : 吨 / 公 项 ): 

题 2-1 表 三 种 农作物 的 产量 





C 5.5 6.5 8.0 


试 建立 三 种 农作物 种 植 计划 的 数学 模型 ,使 得 总 种 植 成 本 最 小 ,总 收成 最 大 。 

2-2 已 知 一 跨 距 为 !、 截 面 为 矩形 的 简 支 梁 ( 见 题 2-2 图 ) ,材料 密度 为 p; 许 用 弯曲 应 力 为 [oj]， 
允许 找 度 为 [有 ,载荷 P 作 用 于 染 的 中 点 ,要 求 梁 的 截面 宽度 6 不 小 于 bsi,。 试 设计 此 梁 
的 数学 模型 ,使 得 其 质量 最 轻 。 


题 2-2 图 “” 简 支 梁 简 图 


2-3 试 求 下 列 无 约束 问题 的 极 值 点 和 极 值 ,并 判断 其 性 质 。 
(1) A(X)=47i 二 32 87. —45—2757 
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(2 FOX 2 rm 1) 
《3) fCR)==xt+2r 2r? 
2-4 用 图 解法 求解 优化 问题 
min f(X)=(zi1—2)’+ (zr —1)’ 
st gi1(X) = 十 2 宇 5 
g2(X)=zi 宕 0 
g3(X)=z; 宕 0 
hi(%)=zi 二 xi—5zx:=0 


2-5 判断 XX =[ 亏 #] 是 否 为 f(XX)= 一 In(1 一 zi 一 zs) 一 lnxi 一 lnzs 的 极 值 点 ? 是 不 是 
全 局 极 小 点 ? 
2-6 用 K-T 条件 判 断 以 下 各 点 是 不 是 下 列 约束 优化 问题 的 最 优 解 。 
min f(X)=— 
(1) 48.t. gi1 (XR)=1=2 十 用 宇 0 yy 本 三 [1 0 和 型 一 [0 一 1]7 
gy CR 10 


min f(X)=zx?+z; 
gi1(X)=zx? 二 zi<9 w=|1t I | 与 一 [0 3]7 
g2 (X) 一 一 2 一 2 十 1] 委 0 
min f(X)= (zxi—3)’+ (xr, —2)’ 
,全 ) 二 对 十 友和 过 5 
gz (是 ) 一 Zi 十 2z 之 4 » XX*=[2 1 
g3(X)=zxi 宇 0 
84(X) 一 zz 之 0 
min 太 (X) 一 好 十 
s.t. g1(X)=Zz? 二 zxi<5 
gi(X)=—x<0 ,， x*=[ 和 3] 
g3(X)=—zx<0 
hi(X)=zxi 二 2zr,=4 
min f(X)=3zxi— zi—273 
s.t. g1(X)=71—zxs<0 
g2(XX)=—Zzi0 
g3(X)=—Zzx;<0 
gi( 关 ) 二 一 x 三 0 
hi()= 二 一 42 十 十 zx? 一 3 三 0 
2-7 求 下 列 约束 问题 的 K-T 点 。 
min f(X)=4zi—3x; 
s.t. gi1(X)=4—zxi—zx0 
g2(X)= 二 zx 十 7 宇 0 
g3( 半 ) 二 一 (x1 一 3)?* 十 zz 十 1 宇 0 


(1) 
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min F(X) 一 2z1 十 2zizz 十 z 一 10z 一 10zz 
(2) 345.t。Zi 《下 ) 一 好 十 对 委 5 
gz (下 ) 一 3zi 十 zz 委 6 
min f(X)=x? 二 xz? 十 zx? 
(3) <5.t. hi(X)=zi+2zx;—zxs=4 
jh (天 ) 一 Zi 一 Zz 十 Z3 一 1 
用 K-T 条 件 或 拉 格 朗 日 函数 求解 以 下 约束 问题 的 最 优 解 。 
x i f(X)=zxix; 
s.t, h(X)=xi 二 zi 一 3=0 
min f(X)=(z1—4)’ 二 (zr: —3)° 
s.t. g1(X)=zxi 二 zi5 
g2(¥X)=Zzi 二 27zxs4 
ga(X)=—zxi0 
8 (天 ) 一 一 zz 魏 0 


min 太 (X) 一 一 In(Czl 十 zz) 
S.t, gi (X)=—zxi 十 2 一 和 0 


(2) 


(3) 
g2(X)=—z1<0 


g3(X)=—zx;0 
min f(X)=zxi+z? 
;bh gi(X) = C1R0 
hi(X)= (zi—1):—zi—4=0 
min f(X)=(zi 二 1)’ 二 (zs—1)’ 
St, gi(R)=(21—1)(4=—71 ~—%;)0 
gz (X)=100—2xi—Zzi 守 0 


(4). 


(5) 


。35 。 


第 3 章 一 维 优化 方法 


所 谓 一 维 优化 就 是 利用 直接 法 求解 一 元 函数 f(z) 的 极 小 点 和 极 小 值 的 问题 ,也 称 为 一 维 
搜索 方法 。 一 维 优化 方法 是 优化 方法 中 最 简单 、 最 基本 的 方法 , 它 不 仅 可 以 用 来 解决 一 维 目标 
函数 的 优化 问题 ,更 重要 的 是 在 多 维 目标 函数 的 优化 过 程 中 ,常常 将 多 维 优化 问题 转化 为 一 系 
列 一 维 优化 问题 来 进行 求解 。 所 以 说 ,一 维 优化 方法 是 优化 的 基础 。 


3.1 一 维 优化 概述 


根据 第 2 章 2.4. 3 节 的 优化 问题 迭代 算法 可 知 ,从 点 X ”出 发 ,在 搜索 方向 S” 上 的 一 维 
搜索 是 以 数值 迭代 的 格式 进行 的 ,和 迭 代 格 式 为 
XD =XH+HaS® k=0,1,%,n 
根据 迭代 格式 ,我们 说 优化 方法 的 主要 研究 内 容 包括 :确定 搜索 步 长 ai ;确定 搜索 方向 
S$” 。 而 一 维 搜索 就 是 研究 迭代 步 长 w 的 确定 方法 。 
我 们 仍 以 二 维 优化 问题 为 例 来 讨论 一 维 优 化 的 原理 。 二 维 函 数 在 设计 空间 内 的 几何 表 
等 值 线 ,如 图 3-1 所 示 。 





示 





图 3-1 二 维 优化 的 降 维 处 理 


在 优化 过 程 中 ,假设 第 有 步 迭 代 搜 索 的 出 发 点 立 ” 为 已 知 , 迭 代 方 向 S* 已 给 定 , 则 优化 
的 任务 就 是 从 半点 出 发 , 沿 方向 S$ 求 函数 的 极 小 值 点 。 
minf (X*'°)=min(f(X™* as'® )) (3-1) 
显然 ,由 于 X* 和 5S" 已 经 确定 ,所 以 式 (3-1) 表 示 对 包含 唯一 变量 w 的 一 元 函数 三 X ”十 
axS$” ) 求 极 小 值 ,得 到 最 优 步 长 w ,从 而 确定 从 XX” 出 发 沿 S” 方 向 上 的 一 维 极 小 值 点 X“”。 
由 此 可 见 , 这 里 一 维 问题 求解 的 实质 就 是 确定 最 优 步 长 ai ,因此 , 式 (3-1) 又 可 写 为 
minf (X10)—=minf(a)—=minf (XH Tas®) (3-2) 
如 图 3-1 所 示 , 下 一 次 寻 优 就 是 从 XX* ?出 发 ,再 确定 一 个 搜索 方向 S$” ,然后 沿 S 7” 
方向 求 最 优 步 长 w+i ,得 到 该 方向 上 的 极 小 点 X“”。 如 此 反复 进行 搜索 和 求解 ,直到 满足 迭 
代 终 止 准则 时 ,得 到 极 值 点 和 X”。 
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由 二 维 优化 问题 的 搜索 迭代 过 程 可 知 , 当 搜索 方向 S“”(k 二 0,1,2,…,n) 确 定之 后 ,多 维 
优化 问题 就 转化 为 多 个 一 维 优化 问题 。 所 以 说 ,一 维 搜索 是 多 维 优化 的 基础 , 即 每 种 多 维 优化 
方法 都 包含 有 一 维 搜索 的 过 程 。 

当然 , 当 目标 函数 /(X) 可 以 进行 解析 运算 时 ,可 以 采用 解析 法 求 得 最 优 步 长 we。 在 搜索 
和 迭代 过 程 中 所 得 到 的 各 极 小 点 ( 瑟 ， ,XX ,…,X”,X"，”,…) 用 变量 表示 , 则 

X= 二 gS‘? 
每 次 迭代 的 目标 函数 值 为 
f(X)=f(X" os )= f(a) 
把 函数 A(X” 十 aS" ) 在 XX" 点 附近 小 邻 域 内 沿 S$” 方向 作 二 阶 泰勒 级 数 展开 ,得 到 


fCX)= AX )++a。 区 W 台 64 娄 用 这 SH + » 0 | 本 Vif CX™*) G SS (3-3) 
其 中 ,唯一 自 变 量 为 a, 对 式 (3-3) 求 导 并 令 导 函数 等 于 0, 有 
HL=[WX® ys 6 SO 十 w 各 LS 条 V2 CCX2 ) 号 S® =0 


解 方程 即 可 得 到 最 优 步 长 w 的 解析 表达 式 为 
中 [VX®)J] S$S® 
[S'®]" .Vif(X®).S® 

但 是 ,从 解析 法 确定 最 优 步 长 w 的 推导 过 程 中 可 知 ,其 中 要 用 到 函数 的 一 阶 和 二 阶 导数 ， 
而 实际 优化 过 程 的 求解 是 很 困难 的 ,因此 这 种 解析 的 方法 只 是 理论 上 有 意义 。 在 实际 应 用 中 ， 
一 般 使 用 直接 搜索 的 方法 一 一 一 维 优化 方法 。 

一 维 优化 的 方法 很 多 ,如 等 分 法 、 分 数 法 (Fibonacci 法 )、 黄 金 分 割 法 (0. 618 法 ) ,二 次 插 
值 法 及 三 次 插值 法 等 。 一 般 来 说 ,方法 简单 ,收敛 速度 慢 ;方法 复杂 ,收敛 速度 快 , 利 疯 共 存 。 
本 章 将 重点 介绍 最 常用 的 两 种 一 维 优化 方法 :黄金 分 割 法 与 二 次 插值 法 ,前 者 简单 ,后 者 稍 
复杂 。 

一 维 优化 (搜索 ) 分 为 两 步 进 行 :第 一 步 需 要 确定 极 小 值 点 所 在 的 初始 搜索 区 间 ; 第 二 步 是 
在 该 搜索 区 间 内 确定 函数 的 极 小 值 点 一 一 最 优 步 长 w。 





(3-4) 


3.2 初始 区 间 的 搜索 


3.2.1 单 谷 ( 峰 ) 区 间 


常用 的 一 维 优化 方法 都 是 通过 逐步 缩小 极 值 点 所 在 的 搜索 区 间 来 求 最 优 解 的 。 一 般 情况 
下 ,我 们 并 不 知道 一 元 函数 f(X) 极 值 点 所 处 的 大 概 位 置 ,所 以 也 就 不 知道 极 值 点 所 在 的 具体 
区 域 。 由 于 搜索 区 间 范 围 的 确定 及 其 大 小 直接 影响 着 优化 方 
法 的 收敛 速度 及 计算 精度 。 因 此 ,一 维 优化 的 第 一 步 应 首先 
确定 一 个 初始 搜索 区 间 ( 即 仅 有 一 个 谷 值 或 峰值 ), 并 且 在 该 
区 间 内 函数 有 唯一 的 极 小 值 存在 。 如 图 3-2 所 示 , 在 S$” 方向 
上 ,区 间 [ai ,ai ] 为 一 维 搜索 前 所 确定 的 单 谷 区 间 , 希 望 该 区 间 
越 小 越 好 ,并 且 仅 存在 唯一 极 小 点 w "” 。 

所 确定 的 单 谷 区 间 应 具有 如 下 性 质 : 如 果 在 Lar ,os ] 区 间 
内 任 取 一 点 eaw<o<as 或 <oz<ai, 则 必 有 





3-2 单 谷 区 间 
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fla) 和 f(a) fa) 
由 此 可 知 , 单 谷 区 间 有 一 个 共同 特点 :函数 值 的 变化 规律 呈现 "大 一 小 一 大 ?或 “高 一 低 一 高 ”的 
趋势 ,在 极 小 点 的 左 侧 ,函数 值 呈 严格 下 降 趋势 ,在 极 小 点 的 右 侧 , 函 数值 呈 严 格 上 升 趋势 ,这 
正 是 确定 单 谷 区 间 的 依据 。 


3.2.2 单 谷 区 间 的 确定 


外 推 法 是 确定 单 谷 搜索 区 间 的 常用 方法 。 因 为 整个 寻 优 过 程 是 用 计算 机 完成 的 ,所 以 这 
里 结合 程序 框图 来 介绍 ,如 图 3-3 所 示 。 

已 知 一 元 函数 f(a) ,假设 在 某 搜 索 方向 S” 上 ,从 w 出 
发 ,给 定 初始 搜索 步 长 为 .确定 单 谷 区 间 的 步骤 如 下 : 

(1) 给 定 wo ,h。 

(2) 令 a 二 mo ,搜索 一 步 得 到 a 二 a 十 h。 搜 索 区 间 的 
缩小 是 通过 比较 各 点 函数 值 的 大 小 实现 的 ,所 以 每 一 个 迭 
代 点 都 要 对 应 一 个 函数 值 。 计 算 w 和 的 函数 值 f(a ) 和 
fla) si fi=f(a), f= f(a) 

(3) 比较 方 与 fi。 

若 户 > 户 ,说 明 函 数值 呈 下 降 趋势 , 则 继续 以 % 为 出 

| 和 | ea 发 点 ,有 :为 步 长 ,计算 a; =as 十 ,搜索 一 步 得 到 点 a;, 记 户 
三 f(aa)( 见 图 3-4(a)); 若 及 二 fi, 说 明 函 数值 呈 上 升 趋 势 ， 

应 改变 搜索 方向 , 令 /= 一 A, 同 时 需 将 w 和 Qs、 刘 和 fi 的 

变量 名 互 换 以 利于 程序 编制 ( 见 图 3-4(b)); 然 后 再 以 w 为 

图 3-3 外 推 法 程序 框图 出 发 点 ,h 为 步 长 ,计算 a; = 二 a; 十 h ,搜索 一 步 得 到 点 a; ,并 记 

f=f(a;). 





ai=a0; f=fo 


a2=a1+h,f2=f (a2) 








f(a) 





(a) (b) 
图 3-4 改变 搜索 方向 


(4) 比较 :与 所 。 

车 广 > 户 ,如 图 3-5 所 示 , 则 区 间 [Lo es] 具有 单 谷 区 间 的 “高 一 低 一 高 ?特征 ,输出 单 谷 区 
间 [La ,os]; 和 否则 , 若 户 过 户 , 说 明 函 数值 仍 是 下 降 趋 势 ,保持 搜索 方向 不 变 ; 为 了 提高 程序 执行 
效率 ,将 步 长 加 倍 A 一 2j, 同 时 需 将 变量 进行 替换 ,wm 一 ,fi 二 fi,as 一 3,f, 二 f;, 重 新 获取 新 
点 as 并 比较 fs 与 f 的 大 小 ,如 图 3-6 所 示 。 变 量 替 换 是 为 了 减少 计算 机 程序 的 变量 个 数 ， 
便于 编程 ,而 且 能 够 使 最 终 得 到 的 单 谷 区 间 用 [Lu ,os | 表示。 
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图 3-5“ 户 > 户 的 情况 3-6 _f: 二 fs 的 情况 


(5) 上 述 搜索 过 程 反复 进行 ,直到 出 现 函 数值 符合 “高 一 低 一 高 ”的 特征 , 即 可 确定 所 需 的 
单 谷 区 间 [ai ,as ] 。 
例 3-1 用 外 推 法 确定 一 元 函数 /(z)==3z’ 一 8z 十 9 的 单 谷 区 间 。 给 定 zo 二 0,h 二 0, 3。 
解 ”根据 图 3-3 的 程序 框图 ,计算 过 程 如 下 : 
Zi=xo=0, fi=f(z1)=9 
Xs=Xi 二 h=0.3, f=f(x;:)=6.87 
比较 f; 与 f1。 由 于 所 之 fi，, 函 数值 呈 下 降 趋势 , 需 继续 向 前 搜索 
ZXs=Xzs 二 Th=0.6, fs=f(zx3)=5.28 
比较 f; 与 户 。 由 于 f; 之 f;, 需 继续 搜索 , 取 步 长 h 二 24 二 0.6, 并 作 变 量 替换 
ZI 一 Z 一 0.3， f=f,=6.87 
2 一 Za 一 0.6， f:=f=5.28 





搜索 得 到 新 点 
zi=Zzzth=1.2, © fs=f(zi)=3.72 
比较 户 与 户 。 由 于 f; 之 fs ,继续 搜索 ,再 次 加 大 步 长 ,h= 二 24 二 1.2, 变 量 替换 
Zi 一 Zoo 一 0.6， f=f;=5.28 
六 == 二 二 3 
搜索 得 到 新 点 
Za 一 Tz 十 /一 2.4， fs=f(xri)=7.08 
比较 户 与 户 。 由 于 为 盖 户 , 户 志方, 呈现 单 谷 区 间 的 “高 一 低 一 高 > 特征, 故 所 求 函 数 的 单 谷 
区 间 为 Lw ,as] 王 [0.6,2.4]。 
由 外 推 法 得 到 的 单 谷 区 间 可 能 是 [w ,a;], 也 可 能 是 [a; ,w ] ,但 它们 都 含有 唯一 的 极 小 值 
点 ,不 影响 一 维 搜索 的 最 终结 果 。 


3.3 黄金 分 割 法 


在 实际 的 优化 方法 中 ,应 用 最 为 广泛 的 一 维 搜索 方法 是 黄金 分 割 法 。 黄 金 分 割 法 是 一 种 
等 比例 的 直接 搜索 方法 ,通过 单 谷 区 间 的 不 断 缩 小 ,直至 区 间 长 度 小 于 等 于 规定 精度 ,从 而 得 
到 最 优 解 的 数值 近似 解 。 因 为 每 次 缩小 后 的 区 间 长 度 与 原 区 长 度 之 比 为 0. 618, 故 又 将 其 称 
为 0.618 法 。 黄 金 分 割 是 公元 前 六 世纪 古 希 腊 数 学 家 毕 达 哥 拉 斯 所 发 现 ,后 来 古 希 腊 美 学 家 
柏拉图 将 此 称 为 黄金 分 割 。 
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千 百 年 来 , 它 被 广泛 运用 于 几何 学 、 建 筑 设计 绘画 艺术 、 有 舞台 艺术 、 音 乐 艺术 管理 等 方 
面 , 甚 至 也 存在 于 自然 界 中 。 如 在 设计 工艺 品 或 日 用 品 的 宽 和 长 时 ,常设 计 成 宽 与 长 的 比 近似 


为 0. 618 ,这 样 易 引 起 美感 ;在 拍照 时 , 常 把 主要 景物 摄 在 接近 于 画面 的 黄金 分 割 点 处 ,会 显得 ， 


更 加 协调 .悦目 ;舞台 上 报 幕 员 报 幕 时 总 是 站 在 近 于 舞台 的 黄金 分 割 点 处 ,这 样 音响 效果 就 比 
较 好 ,而 且 显得 自然 大 方 , 等 等 。 


3.3.1 区 间 消 去 法 的 基本 原理 


区 间 消 去 法 的 基本 原理 是 逐步 缩小 搜索 区 间 , 直至 搜索 区 间 范 围 达到 要 求 的 精度 范围 
为 止 。 
假设 目标 函数 为 FCX ”十 aiS$”) 王 Fa) , 单 谷 区 间 [Lai ,as 为 已 知 ,区 间 长 度 为 as 一 a 二 i。 
现在 的 任务 是 求 该 区 间 内 在 给 定 搜索 方向 S$” 上 的 极 小 值 点 a”。 
首先 ,在 [Lai ,os ] 内 对 称 地 选取 两 个 点 a 和 a, 且 满 足 
ae 一 ad 一 人 Ka3 一 al ) (3=5) 
a Qi 二 A(ags CO—a1) (3-6) 
式 中 :0<4 过 1 为 单 谷 区 间 的 缩小 系数 。 
计算 点 a 和 a 的 函数 值 , 记 户 =Fa) ,六 = ,并 比较 户 与 访 的 大 小 ,可 能 存在 三 
种 情况 ,如 图 3-7 所 示 。 
f(a) f(a) Jo) 





DO al a2 04 Qs O a Q2 Qa4 Q3 
3-7 比较 户 和 万 大 小 

(1) f; 二 fi: 此 时 必 有 极 小 值 点 a” ELa ,asj, 应 舍 去 区 间 [Las ,as] ,保留 的 区 间 长 度 为 XL， 
缩小 后 的 新 区 间 为 La ,a ]; 

(2) fz 这 fi: 此 时 必 有 极 小 值 点 a”E [as ;os] ,应 舍 去 区 间 [a ,asj ,保留 的 区 间 长 度 为 A4， 
缩小 后 的 新 区 间 为 [as ,os ]; 

(3) 二 二 有 :此 时 必 有 极 小 值 点 a* ELas os], 可 舍 去 区 间 [ai ;as 或 [a ,as]。 为 了 规范 优 
化 程序 ,可 将 (3) 与 (1) 或 (2) 合 并 。 

经 过 f; 和 f, 的 比较 取舍 后 ,缩小 后 所 得 的 新 区 间 长 度 均 为 X41, 将 区 间 端 点 重新 命名 为 
La ,as] ,就 可 继续 进行 新 一 轮 的 区 间 缩 小 操作 。 在 新 区 间 内 再 按 式 (3-5) 和 式 (3-6) 取 两 个 内 
点 ma ai, 并 比较 其 函数 值 f;、f ,就 可 将 单 谷 区 间 再 缩小 一 次 ,此 次 所 得 新 区 间 长 度 应 为 入 lL。 
如 此 循环 ,经 nn 次 缩小 后 ,所 得 区 间 长 度 为 ”1。 因 0<4 二 1, 用 极限 术语 来 描述 为 :对 于 任意 的 
e; 总 存在 N, 当 ?>>N 时 有 7" 委 es, 即 用 此 方法 可 将 单 谷 区 间 缩 小 到 任意 小 , 单 谷 区 间 两 端点 
足够 靠近 , 则 可 以 认为 找到 极 小 值 点 a”。 这 就 是 区 间 消 去 法 的 基本 原理 。 

但 上 述 区 间 缩 小 的 过 程 也 存在 一 定 的 问题 。 我 们 注意 到 ,每 计算 两 个 内 点 a; 和 a4 的 函 
数值 f。 和 fs 后, 才 可 将 单 谷 区 间 缩 小 一 次 。 这 对 于 简单 的 工程 优化 问题 是 可 以 的 ,但 对 于 复 
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杂 的 工程 设计 问题 ,就 显得 计算 工作 量 非常 大 。 我 们 是 否 可 以 提出 一 个 腾 想 :能 否 每 次 只 计算 
一 个 内 点 的 函数 值 , 就 可 将 单 谷 区 间 缩 小 一 次 ? 这 个 回答 是 肯定 的 ,但 是 需要 合理 地 选 定 缩小 
系数 4 的 大 小 。 


3.3.2 区 间 缩 小 系数 4 的 确定 


假设 原 区 间 [ai ,as ] 的 长 度 为 1, 如 图 3-8 所 示 。 如 果 区 间 缩 小 时 f, 二 fi , 则 保留 区 间 [a， 
ou] 的 长 度 为 ,区 间 缩 小 率 为 。 将 缩短 后 的 区 间 重 新 命名 为 [ci ,a ;]。 

按 黄金 分 割 法 的 基本 思想 ,如 要 将 该 区 间 进 一 步 缩 小 , 需 
按 式 (3-5) 和 式 (3-6) 再 计算 两 个 内 点 并 比较 其 函数 值 。 显 
然 ,变量 重 命名 后 ,有 


a1 =a (3-7) 
as = =a1 二 A(as CO—a1) (3-8) 


a4 三 gi 十 A(as 一 a1) (3-9) 
将 式 (3-7) 和 式 (3-8) 代 和信 式 (3-9) ,有 
Ca 一 Ql 十 (Ca 十 A(@a3 ?A ) 一 ai ) 





整理 后 得 到 


3-8 区 间 缩 小 与 长 度 变 化 


ad 一 al 十 2(as 一 aa ) (3-10) 
在 图 3-8 中 ,如 果 令 a1 二 @; ,而 as 二 as 一 A(a; 一 a1), 则 有 下 式 成 立 
a3—A(gs—a)=aiA (as —a) 
化 简 后 得 到 
和 十 4 一 1 二 0 
由 于 (os 一 a ) 关 0, 因 此 得 到 


一 一 1 士 V5 
一 


显然 , 负 根 一 一 ! 二 无 意义 , 故 取 正 根 


Ce 618034az0. 618 


由 图 3-8 中 的 区 间 缩 小 前 后 的 长 度 对 比 , 可 以 看 到 区 间 缩 小 过 程 中 的 区 间 长 度 变化 ,为 保 

证 相同 的 缩小 比例 ,显然 有 
| 

同样 可 得 到 区 间 缩 小 系数 4 二 0. 618。 当 然 , 如 果 在 区 间 缩 小 时 的 函数 值 为 亡 > 广 , 则 保留 区 
间 [as ,as] ,也 可 得 到 同样 的 结果 。 

因此 ,只 要 使 搜索 区 间 的 缩小 系数 =0. 618 ,就 可 使 前 一 次 的 计算 点 及 其 函数 值 留 作 下 
一 次 使 用 ,而 每 次 只 需 计 算 一 个 新 点 及 其 函数 值 ,就 可 将 单 谷 区 间 缩 小 一 次 ,大 大 减 小 了 和 迭代 
过 程 的 计算 量 。 


3.3.3 计算 程序 框图 
黄金 分 割 法 (0. 618 法 ) 的 程序 框图 如 图 3-9 所 示 。 
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a2=a3-M(aa-al ,PP= (a2) 
a4=a1tA(aa-a1), fa=f (a4) 
















Cli=Qa2 Q3=Q4 





02=04, f=fs &4=02, fa=fa 
a4=a1tA(a3-a1) Q2=a3—A(aa-a1) 
fs=f ca) f=f (a;) 


3-9 黄金 分 割 法 程序 框图 


程序 框图 在 使 用 过 程 中 需要 注意 的 几 个 地 方 : 

(1) 程序 人 口 的 单 谷 区 间 [au ,as 由 外 推 法 来 确定 , 即 此 框图 的 程序 人 口 为 外 推 法 的 出 口 ; 
(2) 人 一 0.618; 

(3) e 为 收敛 精度 ,根据 工程 问题 的 设计 要 求 和 设计 目标 而 定 ; 


(4) 满足 收敛 精度 的 极 小 值 点 取 单 谷 区 间 的 中 点 , 即 a* 一 全 全 本 所 。 


例 3-2 用 黄金 分 割 法 求 函数 /(z) 二 3x? 一 8z 十 9 的 极 小 点 。 给 定单 谷 区 间 [0.6,2. 4 ， 
收敛 精度 s=0. 2。 

解 ”一 维 优化 中 的 最 优 步 长 (设计 参数 ) 用 a 表示 还 是 用 z 表示 ,不 影响 一 维 搜索 结果 。 

根据 给 定 的 单 谷 区 间 [0. 6,2. 4] , 取 

Zi 一 0.6， Zzxi=2.4 

(1) 第 一 次 缩小 区 间 。 

计算 两 个 内 点 za 、z4 及 其 函数 值 f;、f,。 

zz 一 ZX3 一 0.618(z: 一 Zi ) 三 2.4 一 0.618(2.4 一 0.6) 一 1.2876， ‘fs=/f(z2)=3.6729 

忆 一 2 十 0.618(zs 一 Zi ) 一 0.6 十 0.618(2. 4 一 0.6) 王 1.7124， f=f(z)=4.0977 
由 于 户 志 六, 故 保留 区 间 [Lzi ,zj 二 E90.6,1.7124]。 作 变量 替换 

2Z3 一 Zi 一 1.7124 
Ti=xs=1.28764, f=fi=3.6729 

第 一 次 缩小 区 间 为 Lzi ,zj 二 [0.6,1.7124]。 因 为 | zs 一 zx1| 二 1.1124 之 e, 所 以 应 继续 缩小 
区 间 。 , 

(2) 第 二 次 缩小 区 间 。 

选取 内 点 zs 

zx;=1,.7124—0, 618(1.7124—0;6)=1.0249, =f(m)3.9520 
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由 于 f; 这 fi, 故 保留 区 间 [ x ,x;] 二 [1.0249,1.7124]。 作 变量 替换 
Xi 二 XxX; 二 1.0249 
z= =1,2876, f= f=3. 6729 
第 二 次 缩小 区 间 为 [zi ,x3] 二 [1.0249,1.7124]。 因 为 |zxs 一 zi | 二 0.6875 之 e, 所 以 应 继续 缩小 
区 间 。 
(3) 第 三 次 缩小 区 间 。 
选取 内 点 zs 
Xx1=1.0249 二 0. 618(1. 7124 一 1. 0249》 一 1.4498， f=f(z)=3.7074 
由 于 fo 三 fs; 故 保留 区 间 [Lxzi ,xz ] 二 [1.0249,1.4498]。 作 变量 替换 
Xs=Zz4=1.4498 
| Zr =1. 2876, :f= =3.6729 
第 三 次 缩小 区 间 为 [zi ,zx3] 二 [1.0249,1. 4498]。 因 为 |zxs 一 zi | 二 0.4249 访 e, 所 以 应 继续 缩小 
区 间 。 
(4) 第 四 次 缩小 区 间 。 
选取 内 点 2 
zz 一 1.4498 天 0: 618(1.4498—1.0249)=1.1872, fs='f(z;)=3.7307 
由 于 二 fi, 故 保留 区 间 [zz ,x3] 二 [1.1872 汇 .4498]。 作 变量 替换 
2 一 Z2 一 1].1872 
z 一 4 一 1.2876， 'f,=f,=3.6729 
第 四 次 缩小 区 间 为 Lz ,zs]=[1. 1872,1.4498]。 因 为 |zs 一 习 | 王 0.2626 二 s, 所 以 应 继续 缩小 
区 间 。 
(5) 第 五 次 缩小 区 间 。 
选取 内 点 zs 
zi 一 1.1872 十 0. 618(1. 4498—1.1872)=1.3495, fi=f(zx,)=3.6675 
由 于 f:>f1 , 故 保留 区 间 [xz ,zs] 王 [1.2876,1.4498] 。 作 变 量 替 换 
zi 一 心 一 1.2876 
zz 一 Z4 一 1.3495， f=f,=3.6675 
第 五 次 缩小 区 间 为 Le ,zxsj] 二 [1. 2876,1. 4498]。 因 为 |z; 一 zi | 二 0.16 过 ,满足 迭代 终止 准 
则 ,说 明 缩小 五 次 后 的 区 间 端 点 已 经 比较 接近 。 这 时 可 计算 内 点 zs 
zi 一 1.2876 十 0. 618(1. 4498 一 1. 2876) 王 1.3878， f=f(zx,)=3.6756 
由 此 可 以 看 到 ,内 点 zz 和 zs 的 函数 值 f; 和 f, 也 是 非常 接近 。 因 此 ,得 到 极 小 点 和 极 小 值 为 


大 = 3687, f°*=f(zr')=3.6704 


3.4 二 次 插值 法 


插值 法 是 用 插值 多 项 式 来 逼近 原 函 数 的 一 种 寻 优 方法 。 所 构造 的 插值 多 项 式 为 二 次 插值 
多 项 式 , 就 称 为 二 次 插值 法 ,也 可 称 为 抛物 线 法 ;如 果 所 构造 的 插值 多 项 式 为 三 次 多 项 式 ,就 称 
为 三 次 插值 法 。 插 值 法 也 是 一 种 直接 搜索 方法 。 

二 次 插值 法 是 利用 选取 的 三 个 插值 节点 来 构造 一 个 二 次 插值 多 项 式 来 逼近 原 函数 的 , 同 
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时 认为 二 次 插值 函数 的 极 小 值 点 就 是 原 函 数 极 小 值 点 的 逼近 (近似 ) 值 。 利 用 二 次 插值 法 求解 
原 函 数 极 小 值 点 的 过 程 可 分 为 两 部 分 讨论 。 


3.4.1 插值 函数 的 构造 


如 图 3-10 所 示 ,假设 已 知 搜索 区 间 为 Lai ,a3j, 在 该 区 间 内 任 选 一 点 @ ;和 且 a 过 az 过 a ,三 点 
对 应 的 函数 值 分 别 记 为 万 、 户 \ 户 。 这 样 可 在 设计 空间 
pi (a3, fi) 内 得 到 三 个 节点 pi (a,f1)、p2z(az ,fi) 和 ps(as,f3)。 
根据 插值 原理 可 知 ,过 三 个 插值 节点 pi 、p;、ps 可 
构造 一 个 二 次 插值 多 项 式 ,表示 为 













Pil(e1,fi) 
Pz (az 万 ) 


pla)=aotar * ata,s* oa’ (3-=11) 
! ! So 式 中 :ao al 、az 为 待定 系数 ,可 由 插值 条 件 求 得 
针 办 al aa a pla)=atar ata * ai=fi 
图 3-10 二 次 插值 函数 构造 [ee 0 
pla)=asta * asa «a= fs 


式 (3-12) 方 程 组 为 三 元 一 次 方程 组 ,三 个 方程 ,三 个 未 知 数 。 其 中 的 wm ,as aa 及 万、 广 、 

fi 均 为 已 知 , 解 此 方程 组 可 求 得 系数 ao ak 和 a;。 随 着 三 个 系数 的 确定 , 则 二 次 插值 多 项 式 

(3-11) 就 随 之 确定 。 在 以 后 的 分 析 中 ,只 用 到 系数 a 和 az , 故 这 里 仅 列 出 它们 的 解 
a = fst (oa)fi+ (a aol)f 


(ai 一 az )(az 一 xs ) (as 一 al ) 
(ai 一 az) 户 十 (az 一 as) 亡 十 (as 一 al) 户 
(ai 一 az) (az 一 as) (as 一 al ) 
原 函 数 是 一 个 任意 函数 (超越 函数 ) ,对 其 进行 解析 运算 可 能 是 十 分 困难 或 复杂 的 ,但 在 原 
函数 基础 上 ,通过 三 个 插值 节点 所 构造 的 二 次 函数 是 一 个 十 分 便于 进行 解析 运算 函数 ,对 其 求 
导 ,并 令 一 阶 导数 等 于 0, 得 


(3=13) 


(3-14) 


&y 一 


=a +2a, 。a 一 0 
a 
可 求 得 二 次 插值 函数 的 极 值 点 为 
Qh 一 亲 一 (3-15》 ， 
将 式 (3-13) 和 式 (3-14) 中 的 ai as 代入 a; ,得 
1 (lao)fst(ai ai)fit(as oi)f; 


中 人 
为 了 便于 计算 及 表达 , 设 定 两 个 中 间 变 量 c 和 c: ,有 
c=(fs—f1)/(a3—a) 
c= [fs— fi)/ Cas 一 aa) 一 ca 一 aa) 
则 wy 可 简化 表达 为 
=0.5 (a tas— ) C3=17) 


显然 ,a; 是 二 次 插值 多 项 式 如 Ca) 的 极 小 值 点 ,而 不 是 原 函 数 f(a) 的 极 小 值 点 ,但 p(a) 是 
ja) 的 一 个 逼近 函数 ,所 以 也 可 认为 史 是 f(a) 极 小 值 点 的 一 个 允 近 值 或 近似 点 。 具 体 地 说 ,如 图 
3-11 所 示 , 就 是 在 搜索 区 间 [a ,qs 内 , 除 az 点 外 ,又 得 到 一 个 接近 f(a) 的 极 小 值 点 的 点 a 二 ay 。 
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原 函 数 ps (a;, 记 ) 





Pi (a1,fi) 
NW Pa (ca 万 ) 


站 由 CI 了 Qs 
图 3-11 原 函 数 与 二 次 插值 函数 的 有 逼近 


根据 直接 法 缩小 搜索 区 间 的 原理 ,通过 比较 两 个 内 点 a 和 a; 的 函数 值 ,就 可 将 搜索 区 间 
缩小 一 次 。 


3.4.2 搜索 区 间 的 缩小 


假设 在 搜索 区 间 [ai ,as ] 内 ,已 知 内 点 及 f= 二 f(az), 取 a 二 a; ,并 计算 f= 二 fl(m)。 通 
过 比较 f; 与 f, ,就 可 将 搜索 区 间 缩 小 一 次 ,但 缩小 后 的 新 的 搜索 区 间 是 什么 ? 即 新 的 搜索 区 
间 的 两 端点 为 何 点 ?这 不 是 一 个 可 以 简单 答复 的 问题 ,这 要 视 a ,as ,as ak 这 四 个 点 的 具体 分 
布 情况 而 定 。 具 体 情 况 主要 应 考虑 三 点 : 

(1) 由 外 推 法 所 确定 的 搜索 区 间 可 能 是 Lu ,asj, 也 可 能 是 [as ,a ], 因 此 搜索 区 间 的 端点 
可 能 是 w 之 a; 或 a; 之 a; 

(2) 插值 函数 的 极 小 值 点 a, 可 能 大 于 cz ,也 可 能 小 于 ww ,因此 内 点 可 能 是 之 或 mw 
>az; 

(3) 两 内 点 函数 值 可 能 是 f, 二 fi 或 二 J。 

综合 考虑 以 上 三 点 ,可 得 到 8 种 具体 情况 ,如 图 3-12 所 示 。 


1 EN i 


一 
Le 
ww 
E> 
ww 
一 
本 
iD 
(2 
mm 
心 
iD 
Lo 





fn 及 万 
f NN f A NN 
3 4 2 1 3 2 4 1 3 2 4 1 
第 一 类 :(as 一 al)(a 一 az) 二 0 第 二 类 :(as 一 al )(as 一 az )<0 


图 3-12 搜索 区 间 缩 小 情况 


可 以 看 到 ,以 上 情况 分 布 比 较 复杂 ,我 们 可 以 将 缩小 区 间 的 过 程 分 两 步 进行 。 

(1) 根据 各 点 排序 ,将 8 种 情况 分 为 两 大 类 。 

第 一 类 :(a 一 w )(w 一 az ) 二 0, 见 图 3-12 左 侧 的 四 种 情况 ; 

第 二 类 ;(@s 一 a1) (a 一 as) 二 0, 见 图 3-12 右 侧 的 四 种 情况 。 

(2) 根据 两 内 点 函数 值 f; 与 f 的 大 小 ,每 一 类 情况 又 可 分 为 两 种 ,如 图 3-12 所 示 。 
第 一 类 :@ 若 户 之 户 , 舍 去 Lai ,az ] ,保留 区 间 [o ,os] ,在 新 区 间 内 进行 变量 替换 ,有 
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o 一 ao， fi=f: 
0 
© 车 fi>f: , 舍 去 Las ai] ,保留 区 间 [ai ,oz ,在 新 区 间 内 进行 变量 替换 ;有 
as 一 ad， fs=f 
第 二 类 :@ 若 户 > 太 , 舍 去 Las ,as ] ,保留 区 间 [ai ,oz] ,在 新 区 间 内 进行 变量 替换 ,有 
as 一 Q2， fs=fe 
o 一 ad，， fi=f 
© 若 户 二 态 , 舍 去 [ai os] ,保留 区 间 [Las ,asj], 在 新 区 间 内 进行 变量 替换 ,有 
CE A 
变量 替换 是 为 了 便于 迭代 运算 。 经 过 替换 ,缩小 后 的 新 区 间 仍 为 Lw ,as ] 或 Las ,a ], 内 点 
仍 为 CQ2 , 且 它 们 的 函数 值 均 为 已 知 。 这 样 可 以 利用 QI 、Q2 和 Q3 这 三 个 插值 节点 重新 构造 二 次 


插值 函数 ,再 次 将 搜索 区 间 缩 小 。 反 复 这 一 过 程 ,可 将 搜索 区 间 缩 小 到 任意 小 ,直至 满足 精度 
要 求 为 上 。 


3.4.3 计算 程序 框图 
二 次 插值 法 的 程序 框图 如 图 3-13 所 示 。 
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fa 态 
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C1=(f3-f1)/(a3-a1) 
c2=[(f2-f1)/(a2-a1)-ce1]/(a2—0) 


a4=0.5(ai+a3-cuyca), fa=f(a 4) 


Qa1=02, f1=f 
Q2=04, f2=f4 


3-13 二 次 插值 法 程序 框图 


例 3-3 用 二 次 插值 法 求 函数 f(z) 二 3x? 一 8z 十 9 的 极 小 点 。 给 定单 谷 区 间 [0. 6,2. 4]， 
收敛 精度 e 二 0. 2。 


解 (1) 初始 插值 节点 。 


第 3 章 “ 一 维 优化 方法 “ 47。 


zl 一 0.6， fi=f(zx1)=5.28 
Za 一 2.4， fa=f(z3)=7.08 
取 区 间 内 的 中 间 点 作为 内 点 zz 


tn 


Xz 7 1 5 f=f(x:)=3.75 


(2) 第 一 次 插值 计算 (计算 二 次 插值 函数 的 极 小 点 )。 
c=(fs— fd zs—z1)=—11664 
c=[(fs—fi)/(zs—z)—e)/(zs—zs)=—4.374 
Zi 一 0.5(zi 十 zs 一 Cl/ycz) 一 1.3333， f=f(zx,)=3.6667 
(3) 第 一 次 缩小 区 间 。 


由 于 fk =0. 0222>e, 不 满足 精度 要 求 , 需 要 继续 进行 插值 搜索 计算 。 首 先 判断 所 


属 的 类 别 , 由 于 (zs 一 z)(z 一 z)<0, 属 于 第 二 大 类 ; 户 盖 户 , 故 舍 去 区 间 [zs zs], 保 留 区 间 
[zi,zs], 在 新 区 间 内 进行 变量 替换 
z= 二 5, 为 二 为 三 3.75 
zz 一 2 二 1.3333， f, 三 f=3,6667 
故 第 一 次 缩小 后 的 区 间 为 [zi ,zj 二 [0. 6,1.5], 继 续 缩小 区 间 。 
(4) 第 二 次 插值 计算 。 








a=(fs—fi)/(z3—zxi)=—0.,88 
c=[(fe—f /zs—z)—a /xz —zx3)=—0.33 
Zi 一 0. 5(Czl 十 zs 一 ci/cz) 王 1.3333， f=f(zx)=3.6667 
(5) 第 二 次 缩小 区 间 。 
由 于 =-0 一 e, 已 满足 精度 要 求 , 一 维 搜索 结束 。 因 为 f; 宇 f,, 故 极 小 点 和 极 小 什 


分 别 为 








”==1. 3 天 二 太一 3.6567 
由 上 例 的 搜索 过 程 可 知 , 对 于 二 次 函数 用 二 次 插值 法 进行 一 维 搜索 ,在 理论 上 只 需 进行 一 
次 搜索 即 可 得 到 最 优 解 ,所 以 二 次 插值 法 的 收敛 速度 比 黄金 分 割 法 要 快 得 多 。 对 于 非 二 次 也 
数 , 随 着 区 间 的 逐渐 缩短 ,函数 的 二 次 性 态 逐 步 加 强 ,收敛 速度 也 是 较 快 的 。 
例 3-4 用 二 次 插值 法 求 函数 f(x) 二 zx! 一 4z 一 6z? 一 16zx 十 4 的 极 小 点 。 给 定单 谷 区 间 
[一 1,6j ,收敛 精度 se 一 0. 05。 
解 〈1) 初始 插值 节点 。 
z=—1l; ff(zi)=19 
B=0 fs F(z 24 
取 区 间 内 的 中 间 点 作为 内 点 zs 


a 一 2.5， fs=f(z2)=—96.938 


2 


(2) 第 一 次 插值 计算 (计算 二 次 插值 函数 的 极 小 点 )。 
c=(fs—fi)/(zi—zi)=—4609.06 
cs=[(fe—fi)/(zzs—zxi)—ci/(zxs—zs)=—1179. 06 
z=0.5(zi+xs~—ei/cs)=1.955, fi=f(z)=—65.467 


» 48 。 


(3) 第 一 次 缩小 区 间 。 


由 于 





2 


fo—fs 
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二 ,不 满足 精度 要 求 , 需要 继续 进行 插值 搜索 计算 。 首 先 判 断 


(zi 一 Xx1)(z4 一 Zz) 过 0, 属 于 第 二 大 类 ;由 于 f=f , 舍 去 区 间 [z ,zxj ,保留 区 间 [x ,Z3 ] ,在 


新 区 间 内 进行 变量 替换 


Zrl 王 Z4 三 1].995， 


fr=fi 二 一 65. 467 


故 第 一 次 缩小 后 的 区 间 为 Lzi ,zsj]=[L1.955,6.0] ,继续 缩小 区 间 。 


如 此 反复 计算 ,迭代 搜索 过 程 如 表 3-1 所 示 。 经 过 6 次 迭代 搜索 以 后 ， 
精度 要 求 。 所 求 的 极 小 点 和 极 小 值 分 别 为 


初始 搜索 
第 1 次 搜索 
第 2 次 搜索 
第 3 次 搜索 
第 4 次 搜索 
第 5 次 搜索 
第 6 次 搜索 


表 3-1 


3. 193 
3. 495 
3.727 


3. 841 


Z "一 3.950， f° = 一 155. 897 

非 二 次 函数 的 二 次 插值 法 区 间 缩 小 
Za 2 f(x) 
6 2 和 一 96. 938 
6 2.9 一 96. 938 
6 3. 193 一 134. 539 
6 3. 495 一 146.776 
6 35.727 一 1535104 
6 3. 841 一 154. 977 
6 3. 912 一 155. 685 








Ah | 一 满足 
fs: 
二 fx} ) 
1. 955 一 65. 467 
3. 193 一 134. 539 
3. 495 一 146.776 
3.727 一 153. 104 
3.841 一 154. 977 
3. 912 一 155. 685 
3. 950 一 155. 897 


如 果 采 用 黄金 分 割 法 进行 一 维 优化 , 则 需 进行 11 次 缩小 区 间 后 ,得 到 极 小 点 和 极 小 值 


3-1] 求 一 元 函数 F(z) 王 2zs 一 5z 十 9 的 极 小 点 ,要 求 : 
(1) 取 初 始点 zo 二 0， 步 长 二 0. 1, 用 外 推 法 确定 其 单 谷 区 间 ; 
(2) 用 黄金 分 割 法 求 其 极 小 点 ,区 间 精 度 e 二 0.01; 
(3) 用 二 次 插值 法 求 其 极 小 点 ,区 间 精 度 e 二 0.01。 


Z =3.997, 


区 王 


题 


一 156.0 


3-2 试 分 别 用 黄金 分 割 法 和 二 次 插值 法 求解 一 元 函数 f(xX) 二 十 6z 一 2z? 一 7 十 4 的 最 优 


解 ,初始 区 间 为 [0,2], 区 间 精 度 e 二 0.01。 


3-3 用 二 次 插值 法 求 函数 f(x) 二 T? 十 e's 的 最 优 解 ,初始 区 间 为 [0,1], 区 间 精 度 e 二 0.001。 
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4.1 多 维 无 约束 优化 概述 


多 维 无 约束 优化 问题 的 一 般 数 学 模型 为 
minf(X) X=[zx: x: … Tri] ER’ (4-1) 
求解 这 类 问题 的 方法 , 称 为 多 维 无 约束 优化 方法 。 

多 维 无 约束 优化 方法 是 优化 方法 中 最 重要 和 最 基本 的 内 容 之 一 。 因 为 它 不 仅 可 以 直接 用 
来 求解 无 约束 优化 问题 ,而 且 实际 工程 设计 问题 中 的 大 量 约束 优化 问题 ,往往 也 是 通过 对 约束 
条 件 的 适当 处 理 , 转 化 为 无 约束 优化 问题 来 求解 的 。 所 以 ,无 约束 优化 方法 在 工程 优化 设计 中 
起 着 十 分 重要 的 作用 。 

根据 多 维 无 约束 优化 方法 在 确定 搜索 方向 时 所 使 用 信息 和 方法 的 不 同 ,可 将 其 分 为 两 大 
类 .一 类 需要 利用 目标 函数 的 一 阶 偏 导数 甚至 二 阶 偏 导数 来 构造 搜索 方向 , 称 为 间接 法 ,如 梯 
度 法 . 共 斩 梯 度 法 .牛顿 法 和 变 尺 度 法 等 。 这 类 方法 需要 计算 目标 函数 的 偏 导 数 , 因 此 计算 量 
大 ,但 收敛 速度 较 快 。 另 一 类 仅 用 各 和 迭代 点 的 目标 函数 值 的 特征 来 构造 搜索 方向 , 称 为 直接 
法 ,如 坐标 轮换 法 、 随 机 搜索 法 和 共 碟 方向 法 等 。 这 类 方法 只 需要 计算 目标 函数 值 , 因 而 对 于 
无 法 求 导 或 求 导 困难 的 函数 ,该 方法 具有 突出 的 优越 性 ,但 是 其 收敛 速度 较 慢 。 

各 种 优化 方法 之 间 的 主要 差异 在 于 搜索 方向 $” 的 构造 ,这 也 是 本 章 所 要 讨论 的 中 心 
内 容 。 


4.2- 梯 度 法 


目标 函数 的 梯度 方向 是 函数 值 增 大 最 快 的 方向 ,而 负 梯 度 方向 则 是 函数 值 下 降 最 快 的 方 
向 。 因 此 ,在 求解 目标 函数 极 小 值 的 优化 设计 过 程 中 ,人 们 很 自然 地 想到 采用 负 梯 度 方向 作为 
搜索 方向 。 

1. 基本 原理 

梯度 法 是 求解 多 维 无 约束 优化 问题 的 解析 法 之 一 。 由 
方向 导数 及 梯度 的 概念 可 知 * 函数 值 下 降 最 快 的 方向 是 梯 
度 方 向 。 因 此 ,选择 目标 函数 的 梯度 方向 作为 搜索 方向 ,就 
可 使 优化 迭代 过 程 的 计算 效率 大 为 提高 。 梯 度 法 就 是 选取 
目标 函数 的 负 梯 度 方向 作为 迭代 的 搜索 方向 ,该 方法 又 称 
最 速 下 降 法 。 梯 度 法 原理 图 如 图 4-1 所 示 。 

梯度 法 是 一 种 古老 的 优化 方法 ,由 于 要 计算 目标 函数 
的 梯度 , 故 属于 解析 法 , 即 间 接 求 优 法 。 如 果 梯 度 法 的 搜索 


、 XO 
方向 记 为 
S9 =—V(X"®) 图 4-1 梯度 法 原理 图 
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或 
53 一 一 WE WCG 
搜索 方向 确定 后 ,可 得 到 对 应 的 迭代 公式 
a. oil eh (4-2) 
RDP 一 由 VES) (4-3) 
为 使 目标 函数 值 沿 搜索 方向 一 V(X ) 能 获得 最 大 的 下 降 值 ,其 步 长 因子 w 应 取 一 维 搜 
索 的 最 优 步 长 
minf (X® +aS$®)= ff(X* +as™.) (4-4) 
2. 计算 步骤 
(1) 任 选 初始 点 于 "” , 选 定 迭 代 精 度 s, 并 令 迭 代 次 数 上 一 0。 
(2) 计算 Xe 点 的 负 梯 度 方向 一 VFCX'2 ) 及 梯度 的 模 | 一 WX) 。 
(3) 判断 终止 迭代 条 件 上 一 VFCX2 ) ‖ 委 es: 若 满 足 , 则 终止 迁 代 ,输出 最 优 解 为 X 7 = 
X ,太一 太 X ); 和 否则 转 下 一 步 。 
(4) 寻求 下 一 个 迭代 点 X*i ”二 一 a W(X ), 步 长 因子 w 为 最 优 步 长 ,由 一 维 搜索 
minf(X* 一 g W(X™ )), 求 得 最 优 步 长 oi ; 令 &=k 十 1, 返 回 第 (2) 步 重新 迭代 。 
梯度 法 程序 框图 如 图 4-2 所 示 。 









计算 YFCXw) 和 | Vf(X®) | 


输出 X 一头 中 
Je 










输入 Sm=-V/(X") 
at: minf (XV+tas®)=f(X Vters ®) 


4-2 ”梯度 法 程序 框图 
例 4-1 用 梯度 法 求 目标 函数 


f(X)=zx?i+25x? 
的 极 小 点 。 已 知 初始 点 X”= 二 [2 2J" ,迭代 精度 s 一 0. 005。 
解 ” 计算 ”点 的 梯度 及 其 模 
f(X")=104, woe”)=| 


2X1 


4 
| -| |， | VCX'™) || =100. 0799 
507zz Jx 100 
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第 一 次 迷 代 以 XX 为 起 点 , 沿 一 V(X ) 方 向 作 一 维 搜索 , 求 最 优 步 长 。 
人 一 WO ON 一 2 ee 4 人 2 4ao 
Rr [| | 100] ot 
利用 解析 法 求解 : 


minf(X'”)=minf(X” 一 ao V(X "))=min{(2—4a0)’+25(2— 100&)°} 
af XV) 


了 一 一 8(2 一 4ao) 一 5000(2 一 100m) 一 0， wm 一 0.02003 
[ae | 1. 9199 
XX 一 c= 
2 一 100ao」 上 —0.3072X10-? 
3..8298 
wox")=| 
—0. 1536 
表 4-1 所 示 为 各 次 迭代 过 程 的 结果 。 
表 4-1 梯度 法 的 各 次 迁 代 结果 


上 六 各 人) 三 3 6862 


上 | VFCGX ) || =3. 8428>e 


k XD FWD) VX'®) | VX®) | a 
2 4 
0 | ] 104 | | 100. 0799 0. 02003097 
2 100 
1. 919877 3.839754 
1 | | 3. 686164 | | 3. 8428 0. 4815387 
一 0.003072 一 0.153589 
0. 07088695 0. 1417738 
2 | | 0. 130650 [ | 3. 5500 0. 0200307 
0.070887383 3. 544369 


0.06804708 0.1360942 
3 | | 0.004630 | | 0.1362 0. 4815385 
一 0. 00010887 一 0.0054427 
0. 00251250 0.00502501 
4 | | 0.000164 | | 0.1257 0. 0200307 
0. 00251250 0. 1256254 
0. 00241185 0. 0048237 
5 [ | 0.000006 | | 0.0049 
一 0.0000038 一 0. 0001929 
可 以 看 到 ,迭代 5 次 后 


| VX ) | =0. 0049<e 
满足 迭代 终止 条 件 。 因 此 ,该 问题 的 最 优 解 为 
0. 0024 


和 Gd -=[ 
一 0. 0000 


广 一 FX' ) 一 6X10- 


3. 梯度 法 的 特点 
(1) 梯度 法 在 迭代 过 程 中 是 呈 直 角 锯 齿 形 路 线 搜索 ,曲折 走向 得 到 目标 函数 的 极 小 点 
X* ,两 次 搜索 方向 依次 为 SS" 二 一 V(X")、S* ?二 一 VA(X*“?)。 根据 梯度 的 性 质 可 知 


S**0 应 是 目标 函数 等 值 线 在 XX“? 点 的 法 矢量 ,因此 ,S*”、S** ?也 为 正 交 矢量 ( 见 图 4-3 
(a))。 
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(2) 远离 极 小 点 时 , 步 长 较 大 ,函数 值 下 降 较 快 ;而 接近 极 小 点 时 ,函数 值 下 降 十 分 缓慢 ， 
收敛 速度 也 极其 缓慢 。 因 此 ,对 于 较 复 杂 的 优化 问题 ,梯度 法 不 具有 实用 价值 。 

(3) 梯度 法 在 迭代 开始 时 函数 值 下 降 得 较 快 ,因而 常 在 其 他 优化 方法 中 作为 初始 迭代 法 。 

(4) 对 于 目标 函数 等 值 线 为 同心 圆 簇 的 优化 问题 ,由 任意 初始 点 出 发 , 沿 负 梯 度 方向 仅 一 
次 搜索 即 可 达到 全 局 极 小 点 ( 见 图 4-3(b))。 


X2 XO 





-Vv/(X®™) 
f (X=co 
(a) 


图 4-3 二 维 问题 梯度 法 的 迭代 路 线 





4.3 牛 顿 法 


1， 基 本 原理 

牛顿 法 是 梯度 法 的 进一步 发 展 , 其 基本 思想 是 在 求 目标 函数 f(X) 的 极 小 值 时 , 设 目 标 函 
数 F(X) 具 有 二 阶 连续 偏 导数 ,将 f(X) 在 点 Xe 泰勒 (Taylor) 展 开 , 取 其 二 次 近似 函数 式 
p(X) ,然后 求 出 二 次 函数 p(X) 的 极 小 点 并 以 极 小 点 作为 原 目 标 函 数 的 近似 极 小 点 。 若 此 值 
不 满足 精度 要 求 , 则 以 此 近似 极 小 点 作为 下 一 次 迭代 的 初始 点 ,继续 以 上 过 程 , 一 直 迭 代 下 去 ， 
直到 所 求 出 的 近似 极 小 点 满足 精度 要 求 为 止 。 

2. 牛顿 法 的 迭代 公式 

将 函数 f(X) 在 点 X% 处 展 成 泰勒 二 次 近似 式 


f XAX® HLV KR® )]F(X 一 Xe ) 十 二 (大 一 Xe )"H(X®)(X—X®) 
2 


这 里 ,HH(X” ) 是 函数 f(X” ) 的 二 阶 偏 导数 矩阵 , 即 Hessian 矩阵 。 根 据 无 约束 优化 极 值 存 在 
的 必要 条 件 VA(X) 二 0, 有 
VA(X®™®)++H(X®)(X—X*)=0 
—V(X®*)=H(X")(X—X"*) 
X=X*—[H(X®)] VICX™®) 
上 式 可 写 为 迭代 公式 
HS)] VX.) (4-5) 
对 于 二 次 函数 f(X) ,泰勒 展开 式 不 是 近似 的 ,而 是 精确 的 。 由 于 HCX” ) 是 一 个 常量 (其 中 
各 元 素 均 为 常数 ) ,因此 若 /(X) 是 正定 二 次 函数 ,只 经 一 步 就 可 以 收敛 到 X* , 则 XX* 就 是 f(X) 的 
极 小 点 。 二 次 函数 与 一 维 搜索 公式 XX“ 二 XX* 十 mxX" 比较 ,S 二 一 LH(X®)] ?VA(X") ,a 
三 1, 则 说 明 从 初始 点 出 发 一 步 就 可 达到 最 优点 。 
例 4-2 用 牛顿 法 求 目标 函数 
f(X)=zxi+25z? 
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的 极 小 点 。 已 知 初始 点 和 ”二 [2 2] ,迭代 精度 es 一 0. 005。 


解 vox")=[ | =| 4 | 
50z2 Jx®" 100 


2 :0 
Hx)—w/ CR)=| | 

0 50 
1/2 0 ] 


H(X®) -| 
[ | 0 1/50 


0 
1) = 本" = HX )] V(X )= [| 


而 
| VFCX2 ) | 三 0.0 一 e 
满足 迭代 终止 条 件 。 因 此 ,该 问题 的 最 优 解 为 


0 
¥' = =| | f' =f(X°)=0 


可 以 看 到 ,由 于 二 次 函数 的 泰勒 展开 式 是 精确 的 ,所 以 从 初始 点 出 发 ,一 步 迭 代 就 可 达到 
最 优点 。 

牛顿 法 具有 以 下 特点 : 

(1) 目标 函数 必须 具有 连续 的 一 、 二 阶 导数 ; 

(2) 目标 函数 的 Hessian 矩阵 必须 是 正定 且 为 非 奇 异 的 ,否则 无 法 求 Hessian 矩阵 的 
逆 阵 ; 

(3) 目标 函数 维 数 较 高 时 ,计算 工作 量 大 ; 

(4) 牛顿 法 是 一 种 具有 二 次 收敛 性 的 算法 ,对 于 二 次 函数 迭代 一 次 即 可 得 最 优点 。 

3. 阻尼 牛顿 法 的 迭代 公式 

由 于 牛顿 法 迭代 公式 中 没有 步 长 因子 w ;因此 牛顿 法 是 一 种 定 步 长 的 迭代 。 这 对 非 二 次 
函数 有 时 会 出 现 函 数值 上 升 的 情况 。 

例 4-3 用 牛顿 法 求 目标 函数 


大 (天 ) 一 对 一 22325 十 过 十 2 妈 一 2z12s 下 —4xi 十 4 


2 
的 最 优 解 。 已 知 初始 点 为 X==[ 一 0.2 0.2]'。 








3— ea 
一 2 二 zi 一 和 x 一 2.88 
HO = f= | = dl 
一 全 二 4 x 一 1.2 4 
= | ,| 
H(XL)1 :三 二 一 
[HT THT ls 2 
一 和. 455 
X= C— HG(X'”) -ly cx)=| | 
L 下 0. 246 


J(XO ) 一 32.135 之 /CCX ) 一 2.485 
可 以 看 到 ,在 新 点 X，" 的 目标 函数 值 是 上 升 的 。 如 果 再 次 取 初 始点 为 X "一 L1,1] ,其 目标 函 
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数值 为 
f(X™)=4.5 
计算 得 到 新 点 X ”一 [2.5 4.25J"。 可 以 看 到 
f(XV)=5.312>f(X")=4.5 

由 此 可 见 , 牛 顿 法 不 能 保证 在 迭代 过 程 中 的 函数 值 稳定 下 降 . 在 某 些 情况 下 甚至 可 能 造成 
迭代 点 发 散 , 从 而 导致 优化 计算 失败 。 当 初始 点 选取 接近 目标 函数 的 极 小 点 时 ,有 很 快 的 收敛 
速度 ;但 车 初始 点 选取 离 极 小 点 比较 远 , 就 难以 保证 收敛 。 也 就 是 选取 不 同 的 初始 点 得 到 不 同 
的 函数 极 小 点 (有 时 会 出 现 上 升 现象 ) ,造成 这 一 现象 的 原因 主要 在 于 步 长 a 二 1( 该 算法 对 于 
初始 点 的 选取 有 严格 要 求 )。 因 此 ,牛顿 法 的 应 用 受到 限制 。 为 克服 上 述 灿 病 ,对 牛顿 法 加 以 
改进 ,提出 了 “阻尼 牛顿 法 ”或 “修正 牛顿 法 ”。 其 迭代 公式 为 

XP =XV aLHXT) "YX®) (4-6) 
阻尼 牛顿 法 或 修正 牛顿 法 的 程序 框图 如 图 4-4 所 示 。 









输出 于 "一 X 
ww ) 











计算 Ky BAH(X®)! g vf( bp. @ ) 
at: minf (XY+taS ©)=fX V+ars ®) 





图 4-4 修正 牛顿 法 的 程序 框图 


4.4 共 罗 梯 度 法 


1. 基本 原理 
共 罗 方向 的 定义 :假设 A 为 n 阶 实 对 称 正定 矩阵 ,S$"”、S” 为 n 维 空间 R” 中 的 两 个 非 零 
向 量 。 如 果 S .S'2 满足 
LS ] 4S'2 一 0 
则 称 向 量 $S2” .S” 关 于 对 称 正定 矩阵 4 是 共 斩 的 ,或 简称 S ”与 S ”关于 4 共 斩 。 
在 迭代 过 程 中 ,从 初始 点 X2” 出 发 , 沿 该 点 负 梯 度 方向 S$ 进行 一 维 搜索 得 到 X“” ,然后 
从 XX ?出 发 , 沿 与 上 一 次 搜索 方向 S” 相 共 e 的 方向 S*" 进行 搜索 ,也 就 是 说 ,搜索 方 癌 
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S“ ”满足 条 件 
[LS]'AS** "=0 

根据 共 轿 方向 的 原理 ,对 于 一 个 二 维 正 定 函 数 而 言 ,只 要 沿 着 两 共 罗 方 向 S$S* 与 S“*，” 分 别 进 
行 一 维 搜索 ,就 可 以 求 得 目标 函数 的 极 值 点 关 * 。 

2. 确定 共 罗 梯 度 方向 

假设 新 产生 的 方向 为 

S41D 一 一 VCXGHD ) 十 BSw 

其 中 ,B 为 待定 常数 。 可 以 看 到 ,S* "是 S$” 与 一 V(X*") 
的 线形 组 合 。 下 面 我 们 来 确定 满足 共 思 条 件 [S* ]"AS**" 二 
0 的 新 方向 S**? ,如 图 4-5 所 示 。 

对 于 一 个 n 维 的 二 次 函数 


fx) 一 到 XTAX 二 BTX 二 C 





bp 下 D 


如 果 令 g=V/(X) pp 
则 有 Vi(X)=g=AX+B (4-7) 
对 于 迄 代 点 X* 和 X“*， ,有 
g*"=AX™" 二 B 

gD =AX++D 二 |B 
两 式 相 减 , 得 到 一 (4-8) 
将 迭代 公式 Xe 一 Xe 十 auS 沁 代入 式 (4-8) 得 

8 一 4S (4-9) 
式 (4-9) 等 号 两 边 同 乘 以 LS“”] ,得 

[Sr Tt gh ys la AS (4-10) 


如 果 新 方向 S* ”与 S“ 对 4 共 斩 , 则 有 
[Se FSw = 
所 以 
[LS CB Dg) =0 (4-11) 
再 将 S%+? 一 一 W(X4t?) 十 BS 中 二 一 gtD 十 B.S 四 代入 式 (4-11) ,可 得 
[目下 ai 一 ao 


展开 得 到 
[一 HT gt [ee msm et —BLS ] 三 0 (4-12) 
这 里 
la? Tg® =0 (XO 和 Xe+D 梯度 互相 垂直 ) 
[S$'®] gt+ =0 (S 中 沿 负 梯度 方向 ) 
| J gt 一 及 [SS i = 
因此 ,得 到 待定 系数 
(kk 十 1》 站 T p(k+1) (十 1) 2 
ph T wi 


所 以 , 共 配 梯度 法 的 共 斩 方 向 为 
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SD 一 一 8 十 风 S® (4-14) 
3. 迭代 步骤 (以 二 维 为 例 ) 1 

@ 取 初 始点 X” ,确定 计算 精度 s; 

@ 计算 点 X” 的 梯度 g” 二 VA(X™”), 从 XW” 出 发 沿 5S 二 一 g” 方 向 一 维 搜索 ,得 到 
点 书 ” 3; 

四 计算 g 和 po ,确定 共 斩 方 向 S 一 一 8 十 岂 S 0 ; 

加 从 点 瑟 " 出 发 , 沿 5 方向 一 维 搜索 ,就 可 以 达到 优化 点 XX”。 

共 堪 梯度 法 的 程序 框图 如 图 4-6 所 示 。 

















2 
(+) 
|s | 


,二 Sg + SO 
(里 
ls®| 





图 4-6 共 轿 梯度 法 程序 框图 


4. 共 轧 梯度 法 的 特点 

共 轿 梯度 法 是 一 种 具有 二 次 收敛 的 算法 ,是 以 正定 二 次 函数 的 共 思 方 向 理论 为 基础 ,需要 
计算 目标 函数 梯度 ,公式 简单 ,存储 量 少 ,具有 最 速 下 降 的 优点 ,而 且 在 收敛 的 速度 上 比 最 速 下 
降 法 (梯度 法 ) 快 。 

例 4-4 试用 共 轿 梯度 法 求解 二 维 目标 函数 

RSn a rr lO0m —4r2++60 

的 极 小 值 ,初始 点 X= 二 [0,0 ,迭代 精度 s=10“。 

解 (1) 按照 梯度 法 进行 第 1 次 迭代 


Zi = 0 一] 和 
wx")=| | -| | | VX®S) | =10. 7703 
KY ny 


2x2 —T1—4 4 
因此 ,初始 搜索 方向 为 
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10 
SC0) 一 —VACX™ ) =| | 


迭代 格式 为 
(1) 一 W(0) 0 二 0 10 ws l0ao 
Xo 一 Xo 十 mwS [oj+el | I 
三 (X ) 一 76(ao)2: 一 116ao 十 60 
SFE ?1520, —116=0 
最 优 步 长 为 
ao 一 0.7632 
由 此 可 得 到 新 点 及 其 函数 值 为 
x | | f(X")=15.7368 
3.0528J” 


(2) 计算 新 迭代 点 的 梯度 和 共 轿 梯度 方向 ,进行 第 2 次 搜索 
woe)= [| =| 2, 2112 ] 
2zz 一 Z 一 4 JxD 一 5.5264 


| VX'™) | 2 es 
[vx | 0. 3054 


因此 , 共 思 方向 为 
(大 0 ) 上? 0, 8428 
S$ 一 一 内 (着) 十 | Vi SO 一 
f [Wx™) | 6.7480 
7 gd 本 区 6320 十 0. 8428w， ] 
3.0528」 1L6.7480」 [3.0528 十 6.7480w， 
(Xe ) 一 40. 5586u3 一 35. 4285a 十 15. 7368 


(2) 
d 党 一 81.1172w —35. 4285=0 
1 


,a CE» +ai$ -| 


wo 一 0.4368 
根据 迭代 格式 得 到 最 优 解 为 
X= [e 人 | f(xX'”)=8.0000 
6. 0000 


可 见 , 共 示 梯度 法 具有 二 次 收敛 性 ,对 于 二 维 函 数 只 要 经 过 两 次 迭代 就 可 以 达到 极 值 点 。 
4.5 坐标 轮换 法 


坐标 轮换 法 是 求解 多 维 无 约束 优化 问题 的 一 种 直接 法 , 它 不 需要 求 函 数 的 导数 而 直接 搜 
索 目 标 函 数 的 最 优 解 ,该 法 又 称 降 维 法 。 

1. 基本 原理 

坐标 轮换 法 是 无 约 东 多维 函数 的 优化 方法 中 最 简单 的 一 种 , 它 将 一 个 无 约束 n 维 优化 问 
题 转 化 为 依次 沿 着 相应 的 ”个 坐标 轴 方 向 的 一 维 优化 问题 来 求解 。 具 体 和 迭代 过 程 如 图 4-7 所 
示 ( 图 中 上 角 标 表示 办 代 的 轮 数 ,下 角 标 代表 该 轮 迭 代 点 的 序号 。 如 X; ”表示 第 一 轮 搜索 的 
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{3) (2) 
Xo =X 


2 1 
XX =X" 


XV XO 向 
0 Xi 





图 4-7 坐标 轮换 法 原理 图 
第 2 个 迭代 点 )。 
2. 7 维 迭 代 过 程 
(1) 先 将 (n 一 1) 个 变量 固定 不 动 ,只 变化 第 一 个 变量 zx, 即 由 初始 点 出 发 , 沿 着 第 一 个 变 
量 zi 的 坐标 轴 方 向 ei? 二 [1 0 0 … 0] 进行 一 维 搜索 ,得 到 该 方向 的 最 优点 XI?; 
(2) 然后 ,再 保持 (n 一 1) 个 变量 不 变 , 只 对 第 二 变量 x; 进行 一 维 搜索 ,得 到 该 方向 上 的 最 
优点 XX" ,此 时 的 搜索 方向 为 e2* 二 [0 1 0 … 0]'; 
(3) 如 此 分 别 沿 ei1? ,e2”,… ,es 方向 ( 即 各 坐标 轴 方 向 ) 进 行 一 维 搜索 ,并 且 将 前 一 次 搜 
索 得 到 的 极 小 点 作为 本 次 一 维 搜索 的 起 始点 ,如 图 4-7 所 示 , 依 次 进行 一 维 搜索 后 ,完成 第 一 
轮 迭 代 ; 
(4) 车 未 收敛 , 则 再 以 前 一 轮 搜 索 的 末 点 Xw” 为 起 始点 ,进行 下 一 轮 的 循环 ,如 此 一 轮 一 
轮 和 迭代 搜索 ,直到 满足 收敛 准则 ,逼近 最 优点 为 止 。 
3. 迭代 计算 步骤 
(1) 取 初 始点 X =Lzl x … zx,] ,作为 第 一 轮 搜索 的 起 点 ,迭代 终止 精度 为 e, 置 
迭代 的 轮 数 有 二 1, 令 X5* 一 Xi = 二, 取 n 个 坐标 轴 方 向 矢量 为 搜索 方向 
ew=[l 0 0 + 0]' 
eS =[0 1 0 0] 


es*=[0 0 0 … 1] 

(2) 根据 出 发 点 和 搜索 方向 , 沿 第 i 个 坐标 轴 方 向 分 别 进行 一 维 搜索 ,得 到 最 优 迭 代步 长 

和 本 轮 迭 代 的 终点 。 一 维 搜索 的 迭代 格式 为 
XH 一 时 十 atbet (CG=1,2,.,n) (4-15) 
式 中 :k 为 迭代 轮 数 的 序号 , 取 上 二 1,2,… ,i 为 该 轮 中 一 维 搜索 的 序号 ;ei;” 为 第 轮 和 迭代 中 的 
第 i 坐标 轴 方 向 ;ef” 为 第 & 轮 迭 代 中 沿 第 i 坐标 轴 方 向 的 最 优 步 长 。 本 轮 搜索 结束 ,得 到 本 

轮 迁 代 的 终点 

人 (4-16) 
(3) 按 点 距 准 则 |X” 一 X” | 委 e, 判 断 是 否 终止 迁 代 (注意 :采用 和 迭代 准则 是 一 轮 和 迭代 的 
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始点 与 终点 之 间 的 点 距 , 而 不 是 在 某 搜索 方向 上 迭代 点 的 点 距 )。 若 满足 迭代 终止 准则 ,输出 
最 优 解 X 二 XX, ,ff* 三 fA(X* ); 否 则 , 令 & 二 k 十 1, 返 回 步 骤 (2) 继 续 搜 索 。 
坐标 轮换 法 的 程序 框图 如 图 4-8 所 示 。 










介 。， 则 
ita: el 


图 4-8 坐标 轮换 法 程序 框图 


4. 坐标 轮换 法 的 特点 
坐标 轮换 法 简单 易 行 ,但 由 于 只 能 沿 几 个 坐标 轴 方 向 轮流 搜索 ,因而 效率 低 , 特 别 是 在 维 
数 较 高 (2 之 10) 或 目标 函数 性 态 不 好 的 情况 下 ,收敛 速度 很 慢 。 坐 标 轮换 法 的 收敛 效率 在 很 
大 程度 上 取决 于 目标 函数 等 值 线 的 形状 。 如 图 4-9(a) 所 示 ，, 目 标 函 数 等 值 线 为 椭圆 复 , 其 长 
短 轴 与 坐标 轴 平 行 或 与 圆 复 等 值 线 相 同 ,收敛 效率 高 ,速度 快 :在 图 4-9(b) 中 , 当 椭 圆 簇 的 长 
短 轴 与 坐标 轴 斜 交 , 和 迭代 次 数 将 大 大 增加 ,收敛 速度 很 缓慢 ; 在 图 4-9(c) 中 , 若 目 标 函 数 等 值 
最 优点 X 


bp 





(a) 


图 4-9 搜索 过 程 的 几 种 情况 
《a) 搜索 有 效 ‘b) 搜索 低 效 〈c) 搜索 无 效 


"60% 机 械 优 化 设计 


线 出 现状 线 时 , 沿 着 坐标 轴 方 向 搜索 均 不 能 使 函数 值 有 所 下 降 , 坐标 轮换 法 将 失效 ,这 类 函数 
对 坐标 轮换 法 来 说 是 病态 函数 。 
例 4-5 用 坐标 轮换 法 求 目标 函数 
f(X)=zxii+zxi—zriz—10r—4rt+60 
的 无 约束 最 优 解 。 给 定 初始 点 X” 二 LO0 0] ,精度 要 求 s 一 0. 1。 
解 ”根据 坐标 轮换 法 步骤 ,第 一 轮 的 迭代 计算 取 初 始点 


p40 一 改 (0) 一 | 
0 
| 1 0 
=| 上 "=| | 
| 0 1 


首先 沿 坐标 方向 ei” 进 行 一 维 搜索 


0 1 
天 二 Xo0" 二 el” = |+a | |= 时 
0 0 0 


求解 最 优 步 长 a , 即 极 小 化 


搜索 方向 


min (XY )=af —10a 十 60 
此 问题 可 用 一 维 优化 方法 求 出 ai ,在 这 里 用 解析 法 求解 , 令 一 阶 导数 为 零 , 可 得 


5 
ai 一 5， xz 一 | | 
0 


再 以 XI? 为 初始 点 沿 ef) 方向 进行 一 维 搜索 
x =x" +ae? =[0]+e[1 |=[, 


minf (X;" )=ai—9a;+35 
5 
本 人 xp 
至 此 ,第 一 轮 和 迭代 结束 ,得 到 终止 点 X2”。 
对 于 第 一 轮 和 迭代 结果 进行 终止 条 件 检验 
| Xs" —X" | =V 二 4.5 =6.7>e 
可 以 看 到 ,不 满足 迭代 终止 条 件 , 需 继续 进行 下 一 轮 的 迭代 计算 。 取 XI” 二 XX;” ,各 搜索 


方向 不 变 。 具 体 迭 代 过 程 及 其 数据 如 表 4-2 所 示 。 
表 4-2 坐标 轮换 法 各 次 迭代 结果 


求 最 优 步 长 


k Xe ai Xi” oa 2 | Xe 一 Xi 
1 [0 0]7 5 [5 QJ 4.5 [5 4.5]7 6.73 
2 [5. #5 2, 25 [25、 杰 器 1.125 [7 25: 5 有 0258] 2. 516 
3 【7.25 5.025]" 0. 563 [7.813 5.625]7 0. 282 [7.813 5.907] 0. 623 
4 [7.813 5.907 了 0. 141 [7.954 5.917 了 0.071 [7.954 5.978] 0. 158 
5 [7.954 5.978]7 0. 035 [7.989 5.978]7 0.018 [7.989 5.996] 0.04 


由 表 4-2 可 知 ,在 第 五 轮 迭 代 时 有 
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| RR? —¥? || 三 0.0394 一 < 
满足 迭代 终止 要 求 , 故 近似 最 优 解 为 


je 太一 厂 X )=8.000093 


4.6 共 罗 方 向 法 和 鲍威尔 法 


坐标 轮换 法 比较 简单 ,但 不 是 一 种 很 好 的 搜索 策略 。 坐 标 轮换 法 的 收敛 速度 慢 , 原 因 在 于 
其 搜索 方向 总 是 平行 于 坐标 轴 , 不 适应 函数 变化 情况 ;尽管 其 具有 逐步 下 降 的 特点 ,但 往往 路 
程 迁 回 曲折 ,要 变换 多 次 搜索 方向 , 才 有 可 能 求 得 无 约束 极 值 点 ,尤其 在 极 值 点 附近 ,每 次 搜索 
的 步 长 更 小 。 由 此 ,我 们 设想 ,能 否 基 于 坐标 轮换 法 构造 出 一 种 更 好 的 搜索 方法 ,以 便 加 快 收 
敛 速度 呢 ? 下 面 首先 讨论 共 思 方 向 法 。 


4. 6. 1 共 四 方向 法 


1. 共 罗 方 向 的 产生 

在 如 图 4-10(a) 所 示 的 迭代 过 程 中 ,车 把 第 二 轮 迭 代 的 起 始点 Xo” 与 终止 点 X;” 连 接 起 
来 ,就 形成 一 个 新 的 搜索 方向 S$” 王 Xs” 一 Xo ”。S'“” 与 el” 方向 有 何 关系 呢 ? 

如 图 4-10(b) 所 示 ,假设 函数 f(zxi ,xz;) 的 极 值 点 XX" 二 [zi xz? ]” 附近 的 等 值 线 是 近似 
的 同心 椭圆 簇 , 从 两 个 不 同 的 点 出 发 , 沿 给 定 的 两 个 平行 方向 S” 分别 进 行 一 次 一 维 搜索 ,可 
得 到 两 个 极 小 点 X ”和 X”, 显 然 这 两 点 是 两 条 平行 线 方向 与 函数 等 值 线 (椭圆 ) 的 切 点 ,连接 
这 两 切 点 可 构成 一 个 向 量 5”, 即 S” 二 X” 一 X”, 则 可 以 证 明 。 


AS (04) 






1 2) 
XY =X0 





0 XX! XD 


(a) (b) 
图 4-10 二 维 情况 下 的 共 罗 方向 
车 函数 f(zi ,xs) 的 Hessian 矩阵 为 正定 矩阵 , 则 方向 Sm 与 $S“*” 必 满足 
[SV]J'HS?=0 
由 前 述 共 思 方 向 的 定义 可 知 ,满足 上 述 条 件 的 方向 SW 和 SS” 为 共 思 方 向 。 
2. 共 思 方向 的 性 质 
(1) 设 4 为 呈 阶 实 对 称 正定 矩阵 ,S ,S2 ,…,S” 为 对 4 共 斩 的 ?个 非 零 向 量 , 则 这 浆 个 
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向 量 是 线性 无 关 的 ; 
(2) 在 维 空间 中 互相 共 思 的 非 零 向 量 的 个 数 不 超 过 7 个, 即 共 思 e 向 量 的 个 数 最 多 等 于 
n。 单 位 坐标 向 量 系 是 一 组 线性 无 关 的 共 轿 向 量 的 最 简单 例子 , 且 它 们 也 是 正 交 向 量 系 ; 
(3) 设 4 为” 阶 实 对 称 正 定 矩 阵 ,S”(i 一 1,2,…,z2) 是 关于 4 的 ”个 互相 共 斩 的 非 零 向 
量 。 对 于 正定 二 次 函数 f(X) 的 极 小 化 寻 优 问题 ,从 任意 初始 点 出 发 ,依次 沿 5” 方 向 经 nn 次 
一 维 搜索 , 即 可 收敛 到 极 小 点 区" 。 这 种 性 质 表 明 这 种 迭代 方法 具有 二 次 收敛 性 。 
因此 ,对 于 二 元 二 次 正定 函数 ,SS” 为 共 箔 方向 , 若 X 为 初始 点 ,分 别 沿 这 两 个 方向 
作 一 维 搜索 即 可 得 到 极 小 点 。 
明确 了 共 思 方 向 的 概念 ,我 们 再 来 证 明 LS'”]"AS"” 二 0。 设 二 维 函数 在 极 值 点 X" 附近 的 
二 次 泰勒 近似 展开 式 为 
f(X)=f(X" )+[WX" TX—X" )+ 坟 (XX FR" NMR" 41 
由 此 可 求 得 函数 的 一 阶 导 数 
VX=WX')+V fCX" )(X—X") 
故 有 
VXV)=WX)+V fCX" (XY 一 时" ) 
VHFCX2 ) 一 VCX  ) 十 VCX (XH —X") 
由 于 两 平行 方向 S$” 为 等 值 线 的 切线 ,其 切 点 分 别 为 X” 和 X”, 故 方向 S$” 应 垂直 于 
X”、X” 所 处 的 梯度 方向 。 即 有 XW”、X” 为 目标 函数 /(X) 在 S” 方 向 的 极 小 点 ,所 以 在 
X，\X ”两 点 目标 函数 的 梯度 VCX”) 与 WCGCX”) 都 必 与 矢量 S$” 正 交 。 即 


(4-18) 


[SPJ WCGKG ) 一 [So][WFCX HFAX' ) (XV—X* )]=0 (4-19) 

[SJ] WCGK2 )=[SV TVX HV AX )» (XH —X" )]=0 (4-20) 
两 式 相 减 得 

[SP TIWXY)—WXY)=LSY J VAX XY 一 XD) 一 0 (4-21) 


而 S$ 二 X” 一 XW , 故 由 式 (4-21) 可 得 
[SV VAX MR) WARK VIVO 
由 于 及 (X) 二 Vf(X), 故 
[S®J'H(X*)(X™—X")=[SV"JH(X' )S* 一 0 (4-22) 

上 述 证 明 过 程 可 推演 到 维 函 数 , 即 在 维 空间 中 可 以 同时 构成 4 个 关于 HH 的 共 思 方 向 
S” ,S”，…,S'”。 对 于 对 称 正定 二 次 n 维 函 数 ,从 任意 初始 点 兰 ” 出 发 , 沿 着 这 个 线性 无 关 的 
方向 组 进行 一 维 搜索 ,就 得 到 目标 函数 的 极 小 点 X" 。 因 此 , 共 孝 方向 法 具有 有 限 步 收敛 的 特 
性 ,通常 称 具有 这 种 性 质 的 方法 为 二 次 收敛 法 。 但 对 于 非 二 维 目 标 函 数 ,经 过 有 限 步 共 胃 方 向 
的 一 维 搜索 , 则 不 一 定 就 能 达到 极 小 点 。 在 这 种 情况 下 ,可 取 其 二 次 泰勒 近似 式 加 以 讨论 。 

3. 共 思 方 向 法 的 基本 原理 

在 共 辊 方向 法 的 迭代 过 程 中 ,首先 采用 坐标 轮换 法 来 进行 第 一 轮 迭 代 , 而 且 每 轮 迭 代 的 最 
末 一 个 极 小 点 和 初始 点 相连 构成 一 个 新 方向 S 窟 ! ,并 以 此 新 方向 作为 下 一 轮 迭 代 方 向 组 的 最 
末 一 个 方向 ,同时 去 掉 上 一 轮 的 第 一 个 搜索 方向 $1”, 得 到 下 一 轮 迭 代 的 方向 。 如 此 进行 下 
去 ,直到 求 得 问题 的 极 小 点 。 

4. 算法 步骤 

以 二 维 问题 来 说 明 共 轿 方向 算法 的 步 又 。 
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(1) 令 搜索 迭代 循环 的 轮 数 上 一 1, 确定 初始 点 Xg ,将 初始 搜索 方向 组 取 为 坐标 轴 方 向 
=[1 oj， s 多 =[0. 1] 
(2) 从 X89 出 发 ,依次 沿 Sf? 和 Sf 进行 一 维 搜索 ,分 别 得 到 相应 的 极 小 点 Xf 、X ; 
(3) 构造 新 方向 
SP =xP + x 
沿 S9% 进行 一 维 搜索 ,得 到 第 不 轮 循环 的 极 小 点 XX 的 ; 
(4) 取 下 一 轮 循环 的 初始 点 
KtD 一 大 (5 
同时 去 掉 原来 的 第 一 方向 Si? ,构造 新 的 搜索 方向 组 
SIttD 一 S， StD 一 S4 
邻 k=k 十 1, 转 到 步骤 (2) 继 续 搜索 ,循环 步骤 (2) 至 (4) ,直到 满足 收敛 条 件 | Xg 一 Xio | 二 
< 时 ,迭代 计算 结束 。 
共 罗 方 向 法 的 程序 框图 如 图 4-11 所 示 。 










输入 XE, n 


XV XS ekl 










XOX +a 人 SA 


a :miny(X 负 +e 多 S 久 ) 


f°/(X") 






用 让 
SW 一 0 
做 月 做 k) 
RO + RD ta 






XH XM 
k) f» 
SY Sm(i=1,2,"°,n) 


4-11 共 声 方向 法 程序 框图 


4.6.2 鲍威尔 法 


1. 基本 原理 
共 示 方向 法 在 迭代 过 程 中 ,要 求 各 搜索 方向 组 的 向 量 S;* (i 二 1,2,…,n) 线 性 无 关 , 但 经 


*。 64。 机 械 优 化 设计 


过 守 轮 和 欠 代 后 ,新 产生 的 方向 组 极 有 可 能 会 出 现 线性 相关 或 近似 线性 相关 的 情况 ,从 而 搜索 过 
程 在 降 维 的 空间 中 进行 而 导致 寻 优 失败 。 在 进行 某 一 轮 搜索 时 ,如 果 由 于 在 第 一 个 分 量 这 个 
特定 的 方向 搜索 没有 进展 , 即 此 次 搜索 步 长 接近 于 零 , 则 可 能 形成 两 个 搜索 方向 基本 共 线 ,在 
新 一 轮 的 搜索 中 ,迭代 方向 组 就 成 为 线性 相关 ,从 而 导致 计算 不 能 收敛 到 真正 的 极 小 点 而 失 
败 。 这 种 现象 称 为 “退化 ”。 为 此 ,鲍威尔 在 1964 年 提出 了 对 共 虑 方向 法 的 改进 方法 一 一 鲍 威 
尔 法 (Powell 法 )。 
如 图 4-12 所 示 的 n 维 优化 第 k 轮 迭 代 过 程 。 鲍 威 尔 法 在 每 一 轮 获得 新 方向 S 吕 ,之 后 ,在 
组 成 新 方向 组 时 不 是 简单 地 去 掉 前 一 轮 的 第 一 个 方向 $1”, 而 是 有 选择 地 去 掉 其 中 某 一 个 方 
向 S。(1 委 mm 和 2) ,以 避免 新 方向 组 中 的 各 方向 出 现 线性 相关 的 情形 ,从 而 保证 新 方向 组 比 前 
一 方向 组 具有 更 好 的 共 罗 性质。 为 此 ,鲍威尔 提出 了 是 否 用 新 方向 S, 替换 原 方向 组 中 的 某 
一 方向 来 组 成 新 搜索 方向 组 的 判别 条 件 (Powell 判别 式 )。 
Fs<h, 
| 1 , (4-23) 
(Bt 2F) (RF Am) <sAn (FP — Ey 
式 中 :已 三 XI ) 为 第 k 轮 迭代 中 起 始点 半 ;” 的 函数 值 ;Ff 二 ACX” ) 为 第 & 轮 方向 组 一 维 搜 
索 终 点 半 , 的 函数 值 ;二 了 (X 避 1 ) 二 (2Xiw 一 X65 ) 为 第 k 轮 方向 组 中 XX 对 XX” 的 反射 点 
Xe 的 函数 值 , 即 
大 一 2 让 人 一 汪 介 (4-24) 
4Aw 为 第 & 轮 方向 组 中 沿 各 方向 一 维 搜索 得 到 的 各 函数 值 下 降 最 大 的 方向 ,其 对 应 搜索 方向 
Ss ,如 图 4-12 所 示 。 
A®= 站 古人 和) 一 XP) 二 有 max[ fCXH I— XH] (i=1,25 m,n) (4-25) 


XW (F,) 


函数 值 下 降 最 大 方向 





XY 
图 4-12 鲍威尔 法 的 迭代 过 程 (空间 投影 图 ) 
假设 第 轮 迭 代 函 数值 下 降 最 大 时 所 对 应 的 方向 为 Sw , 若 同时 满足 Powell 判别 式 , 则 在 
第 k 十 1 轮 循环 中 选用 新 方向 S91 ,并 将 S91 补 入 第 上 十 1 轮 循环 的 基本 方向 组 的 最 后 ,同时 去 
掉 原 方向 Sw , 即 以 Si1° ,$2 ，… ,S11 ,So SS 构成 第 & 十 1 轮 循环 的 基本 方向 组 
Si (i 二 1,2,…,n) ,同时 由 X,” 出 发 沿 第 k 轮 搜索 的 初始 点 和 终点 连 线 方向 5 避 , 进行 一 维 
搜索 , 求 出 该 方向 的 极 小 点 X ,并 以 X" 作为 第 上 十 1 轮 选 代 的 初始 点 ;否则 , 若 不 满足 Powell 
判别 式 , 则 第 & 十 1- 轮 循环 仍 用 原来 的 个 搜索 方向 (S19 ,$2 ，,…,S,”)。 初 始点 和 X”” 则 应 选 
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取 XXX 两 点 中 函数 值 较 小 者 , 即 
ee Xt = 
(4-26) 
PS BW 
2. 鲍威尔 法 的 特点 
(1) 在 每 一 轮 迭 代 完 成 并 产生 新 的 共 思 方 向 SS 史 ，…S%9 ,S%9 后 , 先 对 共 思 方 向 的 优 
劣 进行 判别 ,检验 它 是 否 与 其 他 方向 线性 相关 或 接近 线性 相关 。 
(2) 若 不 满足 Powell 判别 式 , 则 不 用 $o: 作为 下 一 搜索 的 基本 方向 组 ,仍然 选用 上 一 轮 
搜索 的 基本 方向 组 ,以 保证 能 够 选取 个 线性 无 关 的 方向 。 
(3) 若 共 斩 方 向 满足 Powell 判别 式 , 则 可 用 $ 祝 ;替换 前 一 轮 和 迭代 中 使 函数 值 下 降 最 快 的 
一 个 方向 ,而 不 一 定 替 换 上 一 轮 搜索 基本 方向 组 的 第 1 个 方向 ,以 加 快 搜索 的 收敛 速度 。 
3. 鲍威尔 法 的 迭代 步骤 
(1) 给 定 初始 点 X” 和 人 允许 误差 si 或 e: 。 
(2) 取 守 个 坐标 轴 的 单位 向 量 e;G 一 1,2,… 7) 为 搜索 方向 Si” 二 e;; 置 k 二 1(k 为 和 迭代 轮 
数 ) ,XI 二 XX 。 
(3) 从 Xi” 出 发 ,依次 沿 Si (i 二 1,2,…,n) 进 行 一 轮 n 次 一 维 搜索 
KX =X Ta S® 
得 到 nn 个 极 小 点 六 ;”。 
(4) 计算 各 相 邻 极 小 点 目标 函数 值 的 差 值 , 并 找 出 其 中 的 最 大 值 及 其 对 应 的 方向 
A =max[f (XL)— 大 下风 )]， SLO— RR 
(5) 计算 反射 点 
X=2X OX SH =X CO—X" 
计算 
Fi=f(X%), F,=f(X®), F,=/f(X®,) 
并 判断 是 否 满足 Powell 判别 式 。 
@ 若 满足 Powell 判别 式 , 则 由 XX;” 出 发 , 沿 方向 S$ 号 | 进行 一 维 搜索 , 求 出 该 方向 的 极 小 
点 闵 " ,并 以 该 点 作为 第 & 十 1 轮 迭 代 的 出 发 点 , 即 令 Xn 二 和 X"。 然 后 ,去 掉 方 向 S。 ,而 将 方 
向 $S 避 ,作为 第 & 十 1 轮 和 迭代 的 最 末 一 个 方向 , 即 第 & 十 1 轮 的 搜索 方向 为 
有 
@ 若 不 满足 Powell 判别 式 , 则 进入 第 & 十 1 轮 迭 代 时 , 仍 用 第 & 轮 迭代 的 方向 $4*? = 
Si” ,迭代 初始 点 选取 为 
Fs<Fs XY =X 
ee 和 一 下 全 1 
(6) 检验 是 否 满足 迭代 终止 条 件 
若 满足 
[CFCORI EBS= FR /ARYLD |es 
或 
| X81 — Xs || <e 
则 可 以 终止 迭代 ,X4 2” 即 为 最 优点 ,输出 结果 
>, i ee 
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否则 ,返回 步 又 (3) ,进行 下 一 轮 的 迭代 。 
鲍威尔 法 的 程序 框图 如 图 4-13 所 示 。 
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图 4-13 鲍威尔 法 程序 框图 
例 4-6 试用 鲍威尔 法 求解 无 约束 优化 问题 
大 囊 ) 王 10Czr 十 部 一 5 和 2 十 Czi 一 莹 272 
的 最 优 解 , 已 知 初始 点 Xn 三 LO0 0] ,收敛 精度 s 一 0. 001 。 
解 〈1) 第 一 轮 迭 代 。 
@ 选择 搜索 方向 


四 沿 51" 方向 一 维 搜索 
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minf (X!")=minf(X "Ta $Y ) 王 minL10(a 人 2 一 5)2 十 act] 一 f(al?) 
af(Xi") 


J 一 22al 一 100 一 0， cf 一 4.5455 
Ql 


1 = 十 cf SS 二 六 poo 


0 
@ 然后 ,从 Xi” 出 发 沿 S 方向 进行 一 维 搜索 ,可 得 
4. 54557T 0 4. 5455 
x =—x" ta st =| 和 | +[ ws 上 | oO | 
minf (XY”)=minf (Xi 十 a” $Y)=min[10(a? —0.4545)*+(4,5455—asY )?*] 


af (Xs ) 


i =20(a" —0. 4545)—2(4. 5455—a$? ) =0 


a =0. 8264 
,G0 = + -| 


@ 计算 函数 最 大 值 及 其 相应 的 方向 
fo=f(X6")=250, fi=f(X1")=22.727, fi=f(X;i")=15.214 
A=fo—fi1=227.273,， A:s=fi—f:=7.513 


4. | 
0. 8264 


函数 值 下 降 量 最 大 者 为 AD= A =227, 273 
@ 计算 反射 点 
1 = (1) __ Ww(l) 一 9. 091 
Sh -| en 


一 (Xi ) 一 250， F,=f(X:")=15.214, F,=f(X:")=385.2392 
由 于 FF 之 书 ,不 满足 鲍威尔 判别 式 , 因 此 第 二 轮 和 迭代 仍 沿用 原 搜 索 方 向 组 。 
(2) 第 二 轮 和 迭 代 。 
由 于 FF 过 F;, 故 取 
XX = 于 = | | 


0. 8264 
OD 沿 SP 一 Sf 方向 进行 一 维 搜索 
xP x taPsr =[ 0 re |=[ po 
0. 8264 0 0. 8264 
f(X)=10(4,5455 二 a1” 十 0. 8264 一 5)* 十 (4. 5455 寸 a!? 一 0. 8264)? 
9f(X) 


ga? 





=0， oa 和 2 一 一 0.6762 


a 必 8693 ] 
Xf2 = 
0. 8264 


@ 从 Xi? 出 发 , 沿 S52 二 $I 方向 进行 一 维 搜索 得 极 小 点 
ee 二 er] 
1. 3797 


fo=f (Xo )=15. 214 


@ 计算 函数 值 
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f=fX?)=10.185s fi=f(X2)=6.818 
A=fo—f1=5.029,， A,=f1—f,=3.367 
A =Al，, SS 一 Si 
@ 计算 反射 点 及 验证 判定 条 件 
tn 2X0 XD = 隐 a 
1.9330 
F=f(X”?)=15.2148, F,;=/f(X*)=6.818, Fs;=/f(X?)=1.7496 
检验 是 否 符合 鲍威尔 判别 式 
F;,<=F, 
(Fi+Fs—2F,)(F,—F,—A‘)’:=37.7024 
0.5A‘2 (Fi—F,)’=456. 1453 


则 (Fi 十 Fs 一 2F,)(F 一 F, 一 A 名)* 之 去 A (Fi 一 F,)* ,满足 鲍威尔 判别 式 ,应 该 采用 新 方向 


me i sd 


0.5533 
去 掉 对 应 A;” 的 方向 $1?, 则 下 一 轮 的 初始 点 取 为 5;” 方 向 上 的 极 小 点 XX3”, 沿 5S3” 方 向 进行 
一 维 搜索 
D4 三 关 $2 十 al: S42) 

通过 计算 得 

2.5 

qi” ==2.02499， Xi” 二 | | 
2. 5001 
(3) 第 三 轮 迭 代 。 


XX = 一 | 2.5 | 


2. 5001 
0 
S4) =—S$? 一 [| 
5 至 ge 
0.5533 


沿 Sf? 方向 搜索 


i 25 

2. 5001 1 2. 5001 十 af? 

f(X)=10(2.5 十 2. 5001 十 gi 一 5)? 十 (2. 5 一 2. 5001 十 a 7) 
9f(X) 


03) 
gali 





2. 5 
一 0， ai? 一 0. 00008=0， Xi 一 | | 
2. 5001 


沿 Ss 方向 搜索 
xp x Hopsp = 各 je =[ 2. 5—0. 6762aS” 
2. 5001 0.5533」 | 上 2. 5001 十 0. 5533ag 
f(X)=10(2. 5—0. 6762as? 十 2. 5001 十 0. 5533ago —5)? 


十 (2. 5 一 0. 6762a;” 一 2. 5001 一 0.5533a32 7) 
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9f(X) 


(37 
aa2 





由 二 0 可 得 22 送 0。 所 以 ,Xi ”为 最 优 解 , 即 


(3) 2.5 
= 三 2 5ogt f(X"* )=0.0 


4.7 变 尺 度 法 


变 尺 度 法 是 Davidon 于 1959 年 提出 ,后 又 由 Fletcher 和 了 Powell 加 以 发 展 和 完善 , 故 又 称 
DFP 变 尺 度 法 。 变 尺度 法 是 在 梯度 法 和 牛顿 法 的 基础 上 发 展 起 来 的 , 它 克 服 了 梯度 法 收敛 
慢 、 牛 顿 法 计算 量 大 的 缺点 ,是 求解 无 约束 问题 最 有 效 的 算法 之 一 ,在 工程 优化 设计 中 得 到 了 
广泛 的 应 用 。 

1. 基本 原理 

梯度 法 和 牛顿 法 的 迭代 公式 分 别 为 

XD 一 X0 一 ww VX) 
eet 一 一 由 [CN 让 -WCG ) 

分 析 这 两 种 迭代 公式 可 知 ,梯度 法 的 搜索 方向 为 一 Yf(X”) ,只 需 计算 目标 函数 的 一 阶 偏 
导数 ,计算 工作 量 小 , 当 和 迭代 点 远离 最 优点 时 目标 函数 值 下 降 很 快 ,但 在 迭代 点 接近 最 优点 时 
收敛 速度 很 慢 ,甚至 可 能 和 迭代 失败 ;牛顿 法 的 搜索 方向 为 一 [五 (X"”)] "VA(X” ), 需 要 计算 目 
标 函 数 的 一 阶 偏 导 数 、 二 阶 偏 导 数 及 其 逆 矩 阵 ,计算 工作 量 很 大 ,但 牛顿 法 具有 二 次 收敛 性 , 当 
迭代 点 接近 最 优点 时 收敛 速度 很 快 。 基 于 此 , 变 尺 度 法 综合 了 这 两 种 优化 方法 的 优 劣 ,在 迭代 
过 程 中 先 用 梯度 法 ,后 用 牛顿 法 , 既 保 证 了 整个 迭代 过 程 的 收敛 速度 ,又 避 开 了 牛顿 法 的 Hes- 
sian 矩阵 及 其 道 矩 阵 的 烦琐 计算 ,计算 量 大 为 减少 。 

变 尺度 法 借用 了 牛顿 法 的 迭代 公式 ,不 同 的 是 在 近代 过 程 中 并 不 直接 计算 LH(X”*)] 一， 
而 是 用 一 个 对 称 正定 矩阵 G(X” ) 近 似 地 代替 (或 称 双 近 )[LH(X")] ,使 算法 更 为 有 效 ， 
G(X" ) 在 迭代 过 程 中 随 着 迭代 点 的 位 置 变 化 而 不 断 变 化 ,最 后 允 近 [LH(X")]“。 由 此 可 见 ， 
变 尺度 法 的 关键 在 于 变 尺度 和 矩阵 G(X ) 的 确定 。 

2. 和 迭代 计算 公式 

构造 的 矩阵 G(X" ) 在 迭代 过 程 中 是 变化 的 , 称 为 变 尺度 和 矩阵 。 令 


SO(RHNIWCKDY) 
则 迭代 计算 公式 为 
XD 一 Xe 十 wuS 岂 一 X —aGXH YXY) (4-27) 
若 在 初始 点 X"” 取 G(X ) 一 工 单 位 矩阵 ), 则 迭代 计算 公式 可 写 为 
NED RD WR (4-28) 


相当 于 梯度 法 的 迭代 公式 ,搜索 方向 为 负 梯 度 方向 。 以 后 随 着 迭代 过 程 的 进行 ,不 断 修正 构造 
的 矩阵 GLX* ) ,使 它 在 整个 迭代 过 程 中 逐步 地 逼近 目标 函数 在 极 小 点 处 的 Hessian 和 矩阵 的 逆 
矩阵 [LH(X”)] '。 当 G(X*) 二 [LH(X”)] 时 , 变 尺度 法 的 迭代 公式 就 称 为 阻尼 牛顿 法 的 
和 迭代 格式 , 即 当 迭代 点 逼近 最 优点 时 ,搜索 方向 就 趋 于 牛顿 方向 。 
构造 的 变 尺度 矩阵 应 具有 简单 的 迭代 形式 ,能 利用 本 次 的 迭代 信息 以 固定 的 格式 构造 下 
一 次 迭代 的 变 尺 度 和 矩阵 G(X**?)。 变 尺度 和 矩阵 的 递 推 公式 为 
G(X* DP)=G(X")+E'" (4-29) 
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式 中 :E" 为 第 次 迭代 的 修正 矩阵 


SS [LS'® ]" G™*Ag®H[ Ag |TG® A GOAgL Ag | G'™* 
Qk LS ] Ag [Ag GP*Apg™ [全 Ag LAg™® 人 


其 中 ,AX* 二 XX*1? 一 到 为 两 迭代 点 位 移 矢 量 差 ;Ag 三 8 一 8 一 VJCX4D ) 一 VCXO ) 
为 梯度 矢量 差 , 即 两 迭代 点 的 目标 函数 一 阶 导 数 信息 之 差 。 

3. 计算 迭代 步骤 

(1) 给 定 初始 点 X'" ,迭代 精度 s, 维 数 n。 

(2) 置 0 一 &, 单 位 矩阵 二 Go ,计算 VAX ) 一 g 。 

(3) 计算 搜索 方向 一 Gg 二 S。 

(4) 进行 一 维 搜索 , 求 w 后 得 迭代 计算 点 XX 十 mS 二 Xn。 

(5) 检验 是 否 满足 迭代 终止 条 件 : ‖ VCX**?) ‖ 入 s。 若 满足 , 则 终止 迭代 ,输出 最 优 解 
CD 一 大 COX4+D ) 二 A(X" ); 否 则 ,进行 下 一 步 。 

(6) 检查 迭代 次 数 上 二 n: 若 等 于 ?二 XW”, 则 转 步 又 (2) ;和 奇 k 过 nn,; 则 转 (7)。 

(7) 计算 


E* se 








(4-30) 


人 让 一 ENC 
(+ 一 一 AX 
计算 E'® 
GG 十 E*—>G'* 1) 
然后 , 置 & 十 1 一 &, 转 到 步骤 (3) 。 
变 尺 度 法 程序 框图 如 图 4-14 所 示 。 








be S, Gd 


03kI1SG® 
Vf(X® )=38° 


(MD GD 
-Gg =5 


一 维 搜 索 ah, 使 
f KOAS = minf (XH+as ®) 
XV+aS WS XHD 











V(X ) Sg*), a WA gh 
不 虹 D- 大 由 3A 大 四 厂 QW GO+E 由 二 Gu 


图 4-14 变 尺度 法 程序 框图 
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例 4-7 试用 变 尺度 法 求解 下 列 无 约束 优化 问题 
F(XI=4(z—=5)+ (zs —6) 
的 极 小 点 和 极 小 值 。 取 初始 点 于" 二 [8,9]" ,梯度 精度 s 一 0. 01。 
解 (1) 第 一 次 迭代 。 
初始 点 X” 三 [8,9]”, 则 


1 0 
f(X™)=45, cw 27=| | 
0 1 


根据 目标 函数 的 梯度 函数 ,可 得 X "点 的 导数 值 
A Po 8 一 5) 加 24 
SH df 四 
求 So 搜索 方向 So 一 一 GOOVF(Xo ) 及 新 的 迭代 点 六。 


|。 “ 24 一 24 
S$‘" 一 一 Go gu ye | |- | | 
0° 1JL6 = 


(1) 二 于 人 二 gaoS'" 一 | ,|+w 从 二 六 Dm 
9 -<6 9—6ao 


用 一 维 搜索 方法 求解 最 优 步 长 ao ,本 题 采用 解析 法 求 ao 。 
f(X'")=4[(8—2490)—5J+[(9—60)—6] 


由 极 值 条 件 半 一 一 0, 得 


4680u 一 612 一 0 二 oo 一 0. 1307 
因此 
X 一 [4.8615 8.2154]7， f/(X'"*)=4.9846 
计算 X 点 的 函数 梯度 ,并 检验 迭代 终止 条 件 
ewe) | ee pt 
2(8. 2154 一 6) 4. 4308 
WXY) | = VC 一 1.1078)5 十 (4.4308) 一 4. 5672>e 
不 满足 迭代 终止 准则 ,需要 继续 迭代 。 


(2) 第 二 次 迭代 。 
Ag'” = 一 g'0 cr I ond 
1.5692 
AX'" :这 一 下 (0) 所 二 | 一 | 
一 0.7846 


按 DFP 公式 计算 近似 矩阵 GC”( 变 斥 度 法 ) 








Go 一 Co 十 AX- [AGO j* 人 Ag' [Ag'9 Ge | Ou 1270 
'. LAX™” |] Ag [Ag'™” J]'G'” Ag'™ —0.0315 
求 搜索 方向 $S ”以 及 新 的 迭代 点 书 ?” 
so 一 一 6m8 一 一 GOWC =| 0. cd 
一 4. 4825 


沿 S$ 方向 进行 一 维 搜索 ,解析 法 求 得 
a =0. 4942 


一 0.0315 
1. 0038 


w WE 


| 


»72。 机 械 优化 设计 


因此 xm x+aso | se 
6. 00015 
检验 迭代 终止 条 件 
0. 00016 
V(X? )= | we | VFCX2 ) || =0. 00032<e 
显然 ,满足 精度 要 求 ,迭代 结束 ,输出 最 优 解 为 

芝 " 二 及 2 =| st fX°)=fX 2)=2.1X10™ 

6. 00015 


4. 变 尺度 法 的 特点 

(1) 变 尺 度 法 迭代 的 第 一 步 实质 为 梯度 法 。 在 迭代 开始 时 ,一 般 是 @ = 二 1( 单 位 矩阵 ) ,此 
时 变 尺度 法 的 迭代 公式 就 是 梯度 法 的 迄 代 公 式 。 

(2) 当 变 尺度 矩阵 允 近 [及 (X”)] 时 , 变 尺度 法 的 迭代 公式 就 逼近 牛顿 法 的 迭代 公式 。 

由 此 可 见 , 变 尺度 法 的 最 初 几 步 迭代 与 梯度 法 类 似 ,函数 值 下 降 较 快 ;而 在 最 后 的 几 步 迭 
代 , 与 牛顿 法 相近 ,可 较 快 地 收敛 为 极 小 点 。 变 尺度 法 能 够 克服 梯度 法 收敛 慢 的 缺点 ,但 却 保 
留 了 梯度 法 在 最 初 几 步 迭代 函数 值 下 降 快 的 优点 ;同时 , 它 避 免 了 计算 Hessian 矩阵 及 其 逆 
阵 , 从 而 克服 了 牛顿 法 计算 量 大 的 缺点 ,但 是 具有 较 快 的 收敛 速度 。 

已 有 文献 证 明 , 对 于 二 次 函数 f(X) ,DFP 变 尺度 法 所 构成 的 搜索 方向 S” ,S  ，…,S” 
为 一 组 关于 Hessian 矩阵 的 共 示 方 向 ,所 以 DFP 变 尺度 法 属于 共 轿 方向 法 ,具有 二 次 收敛 性 。 
在 任意 情况 下 ,这 种 方法 对 于 二 次 目标 隐 数 都 将 在 有 限 步 内 搜索 到 目标 函数 的 最 优点 ,而 且 最 
后 的 构造 矩阵 必 等 于 Hessian 矩阵。 


习 题 


4-1 用 梯度 法 求解 下 列 无 约束 问题 的 最 优 解 : 
(1) minf(XX) 二 2z? 十 ,已 知 初始 点 和 ”= 二 [1 1]', 收 化 精度 e 二 0.01; 
(2) minf(X)==(z1 一 2? 十 2 一 2T2)? ,已 知 初始 点 "二 [1 3J' ,收敛 精度 e 二 0. 01; 
(3) minf (XX)==3(z1 一 2)? 十 4(zs 一 3)? ,已 知 初始 点 关中 二 [4 3j'，, 收 合 精 度 e 二 0. 01。 
4-2 用 牛顿 法 求解 下 列 无 约束 问题 : 
(1) minf(XX)==2x? 十 蕉 十 2X1Xy 十 zl 一 Xz 十 2, 给 定 初始 点 六 "二 [0 0]5 ,收效 精度 一 
0.01; 
(2) min 丰 (X) 一 (6 十 Zi 十 zz 和 十 (2 一 3z 一 3z 一 X11X2)? 给 定 初 始点 天 0 一 [一 4 61， 
收敛 精度 e 二 0.01; 
(3) minf(X) 二 Xx? 十 2Zz2 一 2xixs 一 4Xi ,给 定 初 始点 中 二 [1] 1 ,收效 精度 es 一 0.01。 
4-3 用 坐标 轮换 法 求解 以 下 无 约束 问题 : 
(1) min 太 (X) 一 zi 十 16z 十 10zizs ,给 定 初 始点 时 一 [4 3]7, 迭 代 精 度 e 一 0.01; 
(2) minf(X) 二 3z? 十 2Zz? 十 x3 ,给 定 初始 点 怀 " 二 [1] 2 3]5, 和 迭代 精度 es 一 0.01。 
4-4 用 共 罗 梯 度 法 求解 无 约束 优化 问题 : 
(1) minF(X) 王 好 十 2z 十 2ziz 一 2 十 zy 给 定 初始 点 天 ') 一 [0 0]T ,收效 精 度 一 
0. 01; 
(2) minF(X) 王 (1 一 zi)2 十 2(zi 一 好 )2， 取 初始 点 压 0) 一 [0 0]T, 和 迭代 三 次 即 可 ; 


4-5 


4-6 


4-7 
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(3) minf (XX)= (zi+10zs 二 5(z3 一 Zz) 十 (zs 一 2z3)' 十 10(zi 一 x4)! ,给 定 初始 志 
”= 二 [3 一 1 0 1]' ,收敛 精度 e 二 0.01( 注 :最 优 解 为 :X* = 二 [0 0 0 0]',f*==0)。 
试用 Powell 法 求解 无 约束 问题 

minf(X)=1.5zxi++0. 5zi— xixs — 27i 
给 定 初始 点 里 中 二 [一 2 ” 4], 收敛 精度 e 二 0.01。 
假设 无 约束 优化 问题 

minf(X)=zxi 二 3zi— zr 

(1) 试用 Powell 法 求解 ,给 定 初 始点 下 "一 [1 2]' ,收敛 精度 e 二 0.01。 
(2) 车 采用 共 斩 方 向 法 (不 考虑 Powell 判别 式 ) 则 得 不 到 最 优 解 , 试 说 明 其 原因 。 
用 DEP 变 尺 度 法 求解 下 列 问题 的 极 小 点 ， 
(1) minF(X) 王 好 十 3z 十 5zizs 十 3zl 十 zz 给 定 初始 点 辟 0 一 [3 2]7, 收 人 将 精度 e 一 
0.01; 
(2) minF(X) 一 zi 十 z 十 zizo 给 定 初 始点 囊 一 [3 2]5 ,收效 精度 es 一 0. 01; 
(3) minf(X)=x?+27xi—2z rs —47 , 取 初 始点 天 一 [1 1]"', 收 人 证 精度 €= 二 0. 01。 
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机 械 优化 设计 的 工程 实际 问题 绝 大 部 分 都 是 属于 约束 优化 问题 。 约 束 优化 问题 的 数学 模 
型 为 


minf(X) X=[x: wx: … xz]ER" 
Ss.t. g.(X)SO0 (uu=1,2,°.,m) (S51) 
h,(X)=0 (v=1,2,., p<n) 
即 寻 求 一 组 设计 变量 X" 二 [x zz … x,j" ,在 满足 不 等 式 约束 g,(X) 志 0 和 等 式 约束 


h,(XX) 二 0 的 条 件 下 ,使 目标 函数 值 趋 于 最 优 ,达到 最 小 fA(X* )。 求 解 这 类 包含 有 约束 条 件 的 
优化 问题 的 方法 称 为 约束 优化 方法 。 

根据 求解 约束 优化 问题 所 用 的 指导 思想 不 同 , 可 将 约束 优化 方法 分 为 直接 法 和 间接 法 两 
大 类 。 直 接 法 是 在 盖 维 欧 氏 空间 的 可 行 域内 进行 直接 和 迭代 寻 优 , 它 的 每 一 个 迭代 点 都 落 在 可 
行 域内 , 即 优化 过 程 中 的 每 一 个 迭代 点 都 是 可 行 的 设计 方案 。 该 方法 适用 于 求解 只 含有 不 等 
式 约束 的 优化 问题 ,包括 可 行 方向 法 、 随 机 方向 法 和 复合 形 法 等 。 间 接 法 是 通过 对 式 (5-1) 的 
数学 模型 进行 处 理 , 将 约束 优化 问题 转化 为 一 系列 的 无 约束 优化 问题 ,然后 直接 调用 无 约束 优 
化 方法 得 到 该 约束 优化 问题 的 最 优 解 。 该 方法 可 解决 同时 含有 等 式 和 不 等 式 约束 条 件 的 约束 
优化 问题 ,是 最 常用 的 约束 优化 方法 之 一 。 这 类 方法 包括 惩罚 函数 法 二 次 规划 法 和 拉 格 朗 日 
乘 子 法 等 。 


5.1 可 行 方向 法 


5.1.1 可 行 方向 法 的 基本 思想 


可 行 方向 法 是 求解 不 等 式 约束 优化 问题 的 一 种 直接 解法 。 它 的 数学 模型 为 
min f(X) X=[zx: zz … Ti ER 
s.t. g,(X)E<O (uu=1,2,°",m) 
其 基本 思想 是 :从 可 行 点 出发, 沿 可 行 下 降 方向 $S* 进行 搜索 , 求 出 使 得 目标 函数 值 下 降 
的 新 的 可 行 点 。 可 行 下 降 方向 是 指 和 迭代 点 沿 该 方向 作 微小 移动 后 ,所 得 到 的 新 点 仍 是 可 行 点 ， 
且 目 标 函 数值 有 所 减 小 。 从 可 行 域内 的 任意 初始 点 出 发 ,只 要 始终 沿 着 可 行 下 降 方向 进行 一 
维 搜索 ,并 且 不 越 出 可 行 域 ,就 能 保证 迭代 点 逐步 通 近 约束 优化 问题 的 最 优点 。 
依据 此 基本 思想 ,可 行 方 向 法 的 关键 问题 是 选择 可 行 下 降 方向 S” 以 及 沿 S” 方 向 移动 的 
最 优 步 长 a: 。 搜 索 方向 选择 方法 的 不 同 就 形成 不 同 的 可 行 方向 法 。 常 用 方法 有 Zoutendijk 
可 行 方向 法 、Frank-Wolfe 方法 、 简 约 梯度 法 和 Rosen 梯度 投影 法 等 。 


5.1.2 可 行 下 降 方向 的 选择 


根据 第 2 章 约束 优化 问题 的 极 值 条 件 可 知 ,可行 下 降 方向 区 域内 存在 无 数 个 可 行 下 降 方 
向 ,其 中 使 目标 函数 值 取得 最 大 下 降 量 的 方向 称 为 最 优 可 行 下 降 方向 。 很 显然 , 当 点 X” 处 于 


(5=2) 
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可 行 域内 时 ,目标 函数 的 负 梯 度 方 向 就 是 最 优 可 行 下 降 方向 。 当 点 X 2 处 于 几 个 起 作用 约束 
的 交点 或 线 上 时 * 有 
8 (X ) 一 0 (uET) 
号 (XO)<0 (ul) 
式 中 :到 为 点 局 起 作用 约束 的 下 标 集合 。 这 时 ,根据 可 行 下 降 方 向 所 需 满足 的 条 件 
—V/(X)* S$S>0 
Ve(X).» $<0 
只 能 确定 可 行 下 降 方向 的 范围 ,而 无 法 直接 确定 出 最 优 可 行 下 降 方向 。 我 们 可 以 通过 方向 导 
数 的 求解 得 到 最 优 可 行 下 降 方 向 。 
目标 函数 f(XX) 在 点 er 
3) =[W(X®)]'s 
而 梯度 VA(CX* ) 在 PN S 的 线性 函数 ,利用 线性 规划 的 方法 即 
可 求解 得 到 最 优 可 行 下 降 方 向 $。 
min[ V/A(X'”)]'S 
s.t. [Vg.(X®)]'S<O (u€ET) 
[VX )]S <oO 
|s:| 寺 1] (i=1,2," ,n) 


(5-3) 


式 中 :S$S==[st so … 6。 
5.1.3 约束 一 维 搜索 的 最 优 步 长 


最 优 可 行 下 降 方向 S$ 确定 后 ,根据 迭代 公式 
Xt 二 关中 十 gxS'* 
可 计算 得 到 新 的 迭代 点 X**”。 这 时 最 优 步 长 w 的 确定 不 仅 要 保证 点 兰 “* ”为 可 行 点 ,而 且 
目标 函数 必须 具有 最 大 下 降 量 。 这 里 ,约束 一 维 搜索 的 最 优 步 长 确定 过 程 与 无 约束 一 维 搜索 
有 所 不 同 ,前 者 需要 对 产生 的 每 一 个 探测 点 都 进行 可 行 性 判断 ,如 违反 了 某 一 个 或 几 个 约束 条 
件 , 就 必须 重新 调整 步 长 因子 ,以 使 新 的 探测 点 落 在 最 近 的 一 个 约束 曲面 上 或 约束 曲面 的 一 
容许 的 区 间 6 内 。- 可 参考 两 种 方法 来 确定 约束 一 维 搜索 的 最 优 步 长 。 
(1) 首先 沿 可 行 下 降 方向 S% 进行 一 维 最 优化 搜索 ,得 到 最 优 步 长 a" 和 新 点 和 X”。 
Q@ 若 新 点 对 "为 可 行 点 , 则 本 次 迭代 的 最 优 步 长 ai 二 a”。 
@ 车 新 点 "为 不 可 行 点 , 则 应 改变 步 长 ,迫使 新 点 XX" 返回 到 约束 边界 上 来 ;使 新 点 XX 
恰好 位 于 约束 边界 上 的 步 长 a, 即 为 本 次 迭代 的 最 优 步 长 ;ai 二 a 
(2) 可 通过 求解 下 列 一 维 搜索 问题 确定 约束 最 优 步 长 a”: 
min f(X'®++as'®) 
s.t. g(a I0 
h,(X® +aS'® ) 一 0 
ai 宕 0 


5.1.4 算法 步骤 与 程序 框图 
由 数值 和 代 公式 可 知 ,在 可 行 下 降 方向 和 约束 一 维 搜索 的 最 优 步 长 确定 以 后 ,和 迭代 过 程 即 


(5-4) 
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可 持续 下 去 。 可 行 方 向 法 的 算法 步骤 如 下 。 
(1) 在 可 行 域内 确定 一 初始 内 点 XX” ,给 定 收敛 精度 s 盖 0, 置 迭代 次 数 & 一 0。 
(2) 确定 点 立 “的 起 作用 约束 集合 I。 
(3) 车 I 为 空 集 , 且 点 羡 ” 在 可 行 域 内 时 ,如 果 VACX*) 三 e, 则 输出 最 优点 X* = 
XX” ,最 优 值 f(X* ) 二 A(X”), 终 止 程序 ;否则 , 令 S” 二 一 W(X" ), 转 步骤 (6)。 
若 I 为 非 空 集 时 , 转 步 又 (4)。 
(4) 若 点 X“ 满 足 K-T 条 件 , 则 输出 最 优点 X* =X 2 ,最 优 值 f(X" ) 二 A(X*), 终 止 程 
序 ; 否 则 , 转 步 又 (5)。 
(5) 求解 线性 规划 问题 
min[ VA(X'®*)]'S 
s.t. [Vg.(X®)].* SC<O (uEL) 
[VCX'®)]' » S<O 
Is|<1l GG=1,2;,n) 
确定 可 行 下 降 方向 S$” 。 
(6) 沿 S$" 进行 一 维 搜索 确定 约束 最 优 步 长 w ,从 而 得 到 新 迭代 点 和 “+ 。 令 有 =k 十 1, 转 
步骤 (2) 。 
可 行 方向 法 的 程序 框图 如 图 5-1 所 示 。 





线性 规划 法 求解 
可 行 下 降 方向 SO 


SH=-yAX®) 











沿 S% 求 解约 束 最 优 步 长 ws 
HDD eS 


图 5-1 可 行 方向 法 程序 框图 
例 5-1 用 可 行 方 向 法 求解 约束 优化 问题 
min 丰 (X) 王 zi 十 好 一 2z 一 4zz 十 6 
s.t. g1(X)=2zx1—zxs—1<0 
55z 7) 王石 十 zz 一 2 委 0 
ga (天 ) 一 一 ZI 委 0 
gi(X)=—zx;0 
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解 (1) 第 一 次 迭代 。 
取 初 始点 X= 二 [0 0]7 ,计算 A(X ) 二 6。 在 点 XX” 处 ,gs(X) 和 gs(X) 为 起 作用 约束 ， 


故 及 一 (3,4} o 
2 去 ij 人 二 多 
Wexo)=| | ,=| | 
2 = 省 X=) 一 4 


= 
Wea™)=| 辣 


0 
veCxe)=| | 


为 了 在 可 行 下 降 方 向 扇形 区 域内 寻找 最 优 方向 ,需求 一 个 以 SW 二 Ls， 5;] 为 设计 变量 
的 线性 规划 问题 ,其 数学 模型 为 
min [VF(X' )] 7S 一 一 25: 一 45， 
sb, [VBR 
[Vg RDO) “8 =— se0 
[WA 和 全 » S40 
[|s| 志 1 (i=1,2) 
由 图 解法 解 得 第 一 次 迭代 最 优 可 行 下降 方 向 :S" =[L1 1]'。 
沿 方向 S" =[1 1J 进行 约束 一 维 搜索 ,有 


XGO 一 Xeo 十 w Si 一 [ta 河 = i 
0 | Q0 


求解 min f/(X") 2 一 6ao 十 6, 得 无 约束 一 维 搜索 最 佳 步 长 三 1.5, 从 而 得 到 新 迭代 点 
X 一 [1.5 1.5]"。 很 明显 ,点 X" 不 满足 约束 条 件 , 是 非 可 行 点 , 故 需 重新 改变 步 长 使 新 点 
返回 到 约束 边界 上 来 。 经 过 计算 后 ,得 到 最 优 步 长 mo 二 a 一 1。 

因此 ,第 一 次 迭代 得 到 的 新 点 为 X= 二 [1 1]'。 


(2) 第 二 次 迭代 。 
全 二 人 ER 0 
VX = | = ,| 
可 以 判断 ,g,(X) 和 gs(XX) 为 起 作用 约束 , 故 I 二 {1,2)。 


2 
vecx™)=| | 


1 
va -| 


为 了 在 可 行 下 降 方向 扇形 区 域内 寻找 最 优 方向 ,需求 一 个 以 SW 二 [Ls ss 为 设计 变量 
的 线性 规划 问题 ,其 数学 模型 为 


min [VA(X”)]'SY 一 一 2s2 

s.t. [Vgi(X™):]' » $=25—5 0 
[VY gs (XY?)]' » $V=s 二 sO0 
[VA(X™)]' * S$ =—2s,<0 


|s;| 志 1 (一 1,2) 
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由 图 解法 解 得 第 二 次 迭代 最 优 可 行 下 降 方 向 S$ 二 [一 1 1]' 。 然 后, 沿 方向 S2 一 [一 1 1]" 


进行 约束 一 维 搜索 ,有 
x tosm= [i]tal 1]=[ | 


求解 min A(X ) 二 2ai 一 2a 十 2, 得 无 约束 一 维 搜索 最 佳 步 长 wm = 二 0.5, 从 而 得 到 新 迭代 点 
X2 三 [0.5 ”1,5]7 ,该 点 是 可 行 点 。 
继续 迭代 ,有 S'” 二 [0 0] , 即 找 不 到 可 行 下 降 方向 。 故 最 优 解 为 


a 0.5 Wr 2 
A 1s) TE 
5.2 随机 方向 法 


5.2.1 随机 方向 法 的 基本 思想 


随机 方向 法 是 求解 小 型 约束 最 优化 问题 的 一 种 较为 流行 的 直接 解法 。 它 与 坐标 轮换 法 类 
同 , 其 主要 差别 在 于 不 采用 依次 沿 坐标 轴 方 向 进行 搜索 的 规范 化 模式 ,而 是 沿 着 利用 随机 数 产 
生 的 随机 方向 进行 搜索 。 其 基本 思想 可 用 图 5-2 所 示 的 二 维 优化 问题 进行 说 明 。 

在 可 行 域内 任意 选择 一 个 初始 点 X” ,利用 随机 数 
构成 随机 方向 S$” , 按 给 定 的 初始 步 长 wm 沿 5S” 方 向 进 
行 搜索 取得 试探 点 X= 二 XX” 十 aoS" ,检查 点 X 的 适用 性 
和 可 行 性 。 若 满足 约束 条 件 且 函数 值 下 降 ,X 作为 新 的 
起 点 (X” <=X) ,继续 按 上 述 迭 代 公式 在 S$ 方向 取得 新 
点 。 重 复 上 述 步 又 ,迭代 点 可 沿 如 图 5-2 所 示 的 5" 方 
向 逐步 前 进 。 直 至 达到 某 迭 代 点 不 能 同时 满足 适用 性 
和 可 行 性 条 件 时 停止 ,退回 到 前 一 点 作为 该 方向 搜索 中 
的 最 终 成 功 点 , 记 作 XX，”。 然 后 ,将 X” 作 为 新 的 始点 
(XW 二 XX”), 再 产生 男 一 随机 方向 $S” ,重复 以 上 过 程 ， 
得 到 沿 S$” 方向 的 最 终 成 功 点 XX”。 如 此 循环 ,点 列 X”,X”,… ,XX” 必 将 允 近 于 约束 最 优点 ， 
> 

由 二 维 优化 问题 的 随机 搜索 过 程 可 以 看 到 ,随机 方向 法 的 关键 问题 是 确定 初始 点 X” 、 搜 
索 方向 S” 和 步 长 w。 在 这 种 算法 中 ,搜索 方向 SW 和 步 长 因子 w 都 要 根据 目标 函数 的 下 降 
性 和 约束 条 件 的 可 行 性 进行 随机 调整 , 即 每 一 次 迭代 所 计算 出 来 的 新 点 的 目标 函数 值 必须 是 
减 小 的 ,而 且 必须 是 可 行 点 ,这 样 才能 随 着 和 迭代 过 程 的 进行 ,保证 迭代 点 逐步 向 约束 最 小 点 盘 
近 , 最 终 收敛 于 约束 最 优 解 。 


5.2.2 可 行 初始 点 的 选择 


随机 方向 法 的 初始 点 X'o 必须 是 一 个 可 行 点 。 当 约束 条 件 比较 简单 时 ,可 以 人 为 确定 ; 当 
约束 条 件 比较 复杂 时 ,人 为 选择 这 样 一 个 能 满足 全 部 约束 条 件 的 点 是 十 分 困难 的 ,这 时 可 采用 
随机 选择 的 方法 ,利用 计算 机 产生 的 随机 数 来 选择 一 个 可 行 初始 点 X'o 。 

”首先 需 估计 设计 变量 各 分 量 的 上 限 值 5 和 下 限 值 a; 





图 5-2 随机 方向 法 基本 思想 
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dr<b (i=1,2,°.,n) (5-5) 
这 样 , 所 产生 的 随机 点 的 各 分 量 为 
zi =atri(bi—a) (i=1,2y°,n) (5-6) 
式 中 :x; 为 区 间 [L0,1] 内 服从 均匀 分 布 的 个 随机 数 。 不 同 的 编程 语言 (如 C 语言 .B 语言 等 ) 
有 不 同 的 随机 数 函 数 可 供 调用 。 
这 样 产 生 的 随机 点 关 ” 二 [zi” z2” … zs”]" 虽 能 满足 边界 条 件 ,但 不 一 定 能 满足 所 
有 约束 条 件 , 因 此 还 需 经 过 可 行 性 的 验证 。 若 该 随机 点 是 可 行 点 , 则 可 作为 初始 点 X”" ; 若 为 
非 可 行 点 , 则 需 重新 产生 伪 随 机 数 和 随机 点 ,直到 产生 一 个 可 行 的 初始 点 为 止 。 


5.2.3 ”随机 方向 的 产生 
随机 方向 法 中 ,搜索 方向 的 产生 是 从 N 个 点 的 随机 方向 中 选取 一 个 最 优 的 方向 作为 可 行 
搜索 方向 。 首 先 假设 在 区 间 [ 一 1,1] 内 产生 伪 随 机 数 ri”(i 二 1,2,…,n 为 设计 变量 的 维 数 ,j 


二 1,2，……N 为 在 X” 周 围 的 以 搜索 步 长 为 半径 的 圆 上 所 取 的 试验 点 数 。 过 一 点 构成 N 个 7 
维 随机 方向 单位 向 量 





PT Lr? ri DT 《5-72 


起 中 ro sr ,srt 为 形成 第 j 个 随机 单位 向 量 在 区 间 [ 一 1,1] 内 的 个 随机 数 。 由 于 随机 
数 rip 在 区 间 [ 二 1,1] 内 产生 ,所 以 构成 的 随机 方向 矢量 sw 一 定 是 在 4 维 超 球面 空间 里 均匀 
分 布 且 模 等 于 1 的 单位 矢量 。 
取得 N 个 n 维 随机 单位 向 量 后 , 即 可 按 下 式 产生 NN 个 随机 点 关 ” 
XD=XV Taen (j=1,2,.…,N) (5=8) 
式 中 :ao 称 为 试验 步 长 ,可 取 0. 1.0. 01 等 值 。 然 后 ,检验 这 些 试验 点 是 否 可 行 ,并 计算 其 目标 
函数 值 , 取 出 其 中 目标 函数 值 最 小 的 点 , 记 作 XX”, 即 


f(XP)=min(f (XH)} (=1,2,"%,N) (5-9) 
若 X" 为 可 行 点 , 且 f(X") 二 f(X”), 则 取 搜 索 方向 为 
S=X?—xX" (5-10) 


5.2.4 搜索 步 长 的 确定 


随机 方向 法 中 的 试验 步 长 (或 初始 给 定 步 长 ) 的 选取 要 适当 。 试 验 步 长 太 小 ,搜索 方向 的 
确定 将 会 受到 目标 函数 的 局 部 性 质 的 影响 ;如 果 试 验 步 长 太 大 ,同样 数量 的 试验 点 分 布 在 大 的 
圆周 上 ,降低 了 密度 ,可 能 会 将 最 优 方 向 漏 掉 ,影响 搜索 过 程 的 收敛 速度 。 

随机 方向 法 迭代 过 程 中 搜索 步 长 的 确定 通常 有 两 种 方法 。 

1. 定 步 长 法 

在 搜索 方向 S 上 , 步 长 按照 规定 长 度 等 差 递增 ,只 要 新 点 的 目标 函数 值 下 降 且 可 行 , 就 在 
原 基础 上 增加 一 个 定 步 长 一 直 向 前 搜索 ,直至 违背 了 目标 函数 值 下 降 性 或 新 点 的 可 行 性 条 件 
时 为 止 , 把 迭代 点 由 初始 点 移 至 新 点 。 

2. 变 步 长 法 

在 搜索 方向 S 上 , 步 长 按照 一 定 的 比例 系数 等 比 递增 或 递减 。 例 如 以 1. 3 倍 递增 ,每 次 向 
前 的 移动 步 长 为 前 一 次 的 1.3 倍 。 这 样 可 以 有 效 减 小 计算 量 , 提 高 搜索 效率 。 
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5.2.5 算法 步骤 与 程序 框图 


在 初始 点 X'”、 搜 索 方向 S$” 和 步 长 w 确定 以 后 ,随机 方向 法 的 迭代 搜索 过 程 即 可 持续 下 
去 。 随 机 方向 法 的 算法 步骤 如 下 。 
(1) 选取 一 个 可 行 初 始点 X" ,给 定 收敛 精度 e 二 0, 给 定 合适 的 试验 步 长 ao, 置 & 二 0。 并 
检验 初始 点 X" 是 否 满足 可 行 性 条 件 , 若 满足 则 进行 下 一 步 ; 否 则 ,重新 选取 XX" 。 
(2) 产生 NN 个 随机 单位 向 量 e?”(j==1,2,*…,N)。 
(3) 在 以 点 半 ” 为 中 心 ,以 ao 为 半径 的 超 球面 上 产生 N 个 随机 试验 点 美 ”。 
(4) 在 N 个 随机 点 中 , 选 出 极 小 值 点 X”, 产 生 搜 索 方向 S==X" 一 X。 
(5) 从 点 出发, 沿 S 方向 以 加 速 步 长 1. 3ao 进行 搜索 ,得 到 新 点 和 X= 二 XX 十 aoS。 
(6) 若 新 点 羡 满 足 目标 函数 值 下 降 和 约束 条 件 可 行 性 要 求 , 则 继续 以 1. 3c 为 步 长 向 前 
搜索 , 转 步骤 (7); 和 否则 , 取 步 长 a 二 0. 7ao , 转 步 又 (7) 。 
(7) 直至 目标 函数 值 不 再 下 降 而 又 未 破坏 约束 条 件 为 止 , 然 后 ,将 搜索 所 得 的 末 点 作为 下 
轮 搜索 的 初始 点 ,X” < 二 XX, 重 复 步 骤 (2) 和 步骤 (3)。 
(8) 当 满 足 收敛 准则 | f(X) 一 A(X ) <e 时 , 则 结束 程序 ,输出 计算 结果 。 
5-3 所 示 为 随机 方向 法 的 程序 框图 。 
例 5-2 用 随机 方向 法 求解 约束 优化 问题 
min f(X)=zi 二 zx? 
St ZEiTR = 12>0 
0 过 而 过 8 
0 很 委 8 
解 ” 取 可 行 初始 点 X 王 [5 5] ,计算 FOX ) 一 50。 
(1) 第 一 次 迭代 。 
@ 确定 第 一 个 随机 方向 S”，。 
在 区 间 [0,1j 内 生成 两 个 伪 随 机 数 
名 一 0.9， 色 二 0.2 
将 名和 名 转化 为 区 间 [ 一 1,1] 内 的 随机 数 
/和 一 26 一 1 一 0.8 
r 刀 一 26 一 1 一 一 0.6 
确定 第 一 个 随机 方向 





a 1 ri 0.8 
a sa | 
@ 确定 第 一 个 迭代 点 X'"。 
根据 迭代 公式 ,有 
Wo 二 Xio a SD = ye | 
5 一 0. 6ao 
一 维 搜索 求解 后 得 到 最 优 步 长 wo 三 一 1, 故 


-Ts 2] 
5.6 
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I <0 


h(X")=0 和 





产生 随机 数 zf) (i=1,2,…,n; 扩 1,2,… ,NN) 


构成 Y 个 随机 方向 : 
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目标 函数 值 最 小 点 : (XX 中)=min{f(X 中 )} 














产生 搜索 方向 : S=X OO-X 


| rc-=rexeise 


X=X™, f=/(X") 














XO=X 
f(X™)=/(X) 


oe-Ax ss, 


=X,f=/) 


图 5-3 随机 方向 法 程序 框图 


@ 检验 X'" 是否 满 足 约束 条 件 。 

XX 满足 各 约束 条 件 , 因 此 是 可 行 点 ,并 且 f(X"”) 二 49 二 fA(X”) 二 50, 满 足 函 数值 减 小 的 
条 件 。 

(2) 第 二 次 和 迭代。 
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以 XX" 为 初始 点 ,继续 使 用 S$" 方向 直到 不 满足 可 行 性 和 适用 性 条 件 , 再 重新 生成 随机 搜 
索 方向 S” 。 如 此 反复 进行 , 即 可 得 到 该 约束 优化 问题 的 最 优 解 。 

随机 方向 法 对 目标 函数 无 性 态 要 求 ,收敛 快 ( 当 随机 方向 限定 数 足够 大 时 ), 不 受 维 数 影 
响 , 维 数 越 高 越 能 体现 其 优越 性 。 但 对 于 严重 非 线性 函数 ,只 能 得 近似 解 ; 当 随机 方向 限定 数 
不 够 大 时 , 解 的 近似 程度 大 ;对 于 非 凸 函数 ,有 可 能 收敛 于 局 部 解 。 


5.3 复合 形 法 


5.3.1 复合 形 法 的 基本 思想 


复合 形 法 来 源 于 单纯 形 法 ,是 单纯 形 法 在 约束 优化 问题 中 的 发 展 。 所 谓 复合 形 是 指 在 n 
维 设计 空间 的 可 行 域内 由 k(n 十 1<k<2n) 个 顶点 所 构成 的 多 面体 。 复 合 形 法 的 基本 思想 是 : 
在 可 行 域内 构造 一 个 具有 “个 顶点 的 初始 复合 形 , 通 过 比较 复合 形 各 顶点 目标 函数 值 的 大 小 ， 
找到 目标 函数 值 最 大 的 顶点 ( 称 为 坏 点 ), 然 后 以 坏 点 之 外 的 其 余 各 点 的 中 心 为 映射 中 心 , 求 出 
坏 点 的 映射 点 ,并 以 此 映射 点 替换 坏 点 重新 构成 具有 & 个 顶点 的 新 复合 形 。 复 合 形 的 形状 每 
改变 一 次 ,就 向 最 优点 移动 和 收缩 一 步 , 直 至 复合 形 各 项 点 与 其 形 心 通 近 至 满足 迭代 精度 为 
止 。 最 后 复合 形 中 目标 函数 值 最 小 的 顶点 或 中 心 点 可 作为 该 优化 问题 的 最 优 解 。 

由 此 可 见 , 复 合 形 法 的 关键 问题 是 初始 复合 形 的 构造 和 调 优 过 程 。 


5.3.2 初始 复合 形 法 的 构造 


由 于 复合 形 法 是 一 种 在 可 行 域内 直接 寻 优 的 方法 ,因此 要 求 初始 复合 形 必 须 位 于 可 行 域 
内 , 即 其 所 有 的 k(n 十 1 二 & 志 2 个 顶点 都 是 可 行 点 。 个 可 行 点 的 产生 可 采用 如 下 方法 。 

1. 人 为 给 定 上 个 可 行 点 

由 设计 者 预先 选 定 & 个 可 行 的 设计 方案 (对 应 于 设计 空间 中 四 个 点 ), 即 人 工 构 造 一 个 好 
的 初始 复合 形 。 由 于 要 求 & 个 顶点 都 是 可 行 点 , 当 设计 变量 多 ,约束 条 件 复杂 时 ,这 样 做 是 十 
分 困难 的 。 

2. 随机 产生 个 可 行 点 

1) 产生 上 个 随机 点 

根据 随机 数 产 生 的 标准 函数 ,可 以 在 [0,1j] 区 间 内 产生 均匀 分 布 的 随机 数 名 (i 二 1;2,…， 
n)。 利 用 该 随机 数 可 产生 变量 z; 在 给 定 界限 a; 志 zx;<<b; 内 的 随机 数 

Xi=a;té(b—a) (i=1,240°% ,Nn;j=2,35°" ,knt+1) (5-11) 

因 每 产生 一 个 随机 点 ,需要 个 随机 数 , 因 此 ,产生 & 个 随机 点 共 需 要 连续 发 生 kXn 个 随 
机 数 。 

2) 将 非 可 行 点 调 入 可 行 域 

用 上 述 方法 产生 的 个 随机 点 ,并 不 一 定 都 是 可 行 的 。 但 是 ,只 要 它们 中 间 有 一 个 点 在 可 
行 域内 ,就 可 以 将 非 可 行 点 逐一 调 人 可 行 域 。 

将 产生 的 & 个 随机 点 进行 可 行 性 判断 后 重新 排列 ,将 可 行 点 依次 排 在 前 面 ; 如 有 g 个 顶点 
XX ,XX ,… ,XX 是 可 行 点 ,其 他 一 g 个 为 非 可 行 点 。 

先 求 出 g 个 可 行 顶 点 的 中 心 
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9 
X9 = ~ D>)XP (5-12) 


然后 将 第 9 十 1 点 朝 着 点 下 ”的 方向 移动 , 按 下 式 
产生 新 点 , 记 为 总 , 即 
dd. li. re. .| 

新 点 X “实际 就 是 X” 与 原 X“，” 两 点 连 线 的 中 
点 ,如 图 5-4 所 示 。 若 新 点 X“， 仍 为 非 可 行 点 , 按 上 Xx"? 2 
式 再 次 产生 XX ”, 使 它 更 向 X "靠拢 ,最 终 使 其 成 为 
可 行 点 。 

按照 这 个 方法 ,采用 式 (5-13) 就 能 使 X""， 
XX ,XW ,eX 都 变 为 可 行 点 ,这 上 个 顶点 就 构成 
了 初始 复合 形 。 

XPD=XH+0. ERP— KY =0r 5 HE Mat lk) (5-13) 


5.3.3 复合 形 法 的 搜索 策略 及 过 程 


以 图 5-5 所 示 的 二 维 约束 优化 问题 为 例 来 说 明 复合 形 法 的 搜索 策略 及 过 程 。 

(1) 构造 初始 复合 形 : 在 设计 空间 的 可 行 域内 选取 (nz 十 1 委 & 委 27z) 个 点 作为 初始 复合 
形 的 顶点 (如 图 5-5 中 的 半 ”、X?、XX” XX 四 个 点 ,此 时 有 = 二 2n 二 4)。 

(2) 计算 各 顶点 的 函数 值 A(XT”),j 二 1,2,…,k, 并 选 出 好 点 XX 和 坏 点 X'”。 

XfX")=min(f(X) ,j=1,2,.,k)} 
XfXH =max{(f XH),I=1,2,.%,k} 

很 明显 ,图 5-5 所 示 的 初始 复合 形 X“*” 为 好 
点 ;X 为 坏 点 。 由 此 可 大 致 判断 ,在 该 复合 形 
坏 点 X2 的 对 面 , 会 有 更 好 的 点 。 而 一 般 情 况 
下 , 坏 点 X2 和 中 心 点 和 ”的 连 线 方向 为 目标 孙 
gx(X)=0 数值 下 降 的 方向 。 

(3) 计算 除 坏 点 和 只 外 复合 形 的 形 心 
点 。 

X®? 天 Er — Xm) 
若 X” 不 在 可 行 域内 ,此 时 的 可 行 域 一 般 为 
图 5-5 复合 形 法 的 搜索 策略 非 凸 集 , 这 时 再 求 反射 点 也 一 定位 于 可 行 域外 。 

为 使 迭代 过 程 继 续 进行 下 去 , 取 筠 " 为 上 界 ,X 2 为 下 界 , 即 ww 一 T ,b; 二 Xx? (一 1 2 2)， 
重新 随机 产生 上 个 可 行 点 , 重 构 复 合 形 ,返回 步骤 (2)。 

若 X" 在 可 行 域内 ,执行 步骤 (4)。 

(4) Xe 在 可 行 域内 ,在 反射 方向 S 王 X'” 一 X 上 求 反射 点 瑟 ” 。 

时 ( 一 时 人 十 办 一 和 9 十 <(X9 一 天书 ) 

一 般 取 反射 系数 a 二 1.3。 

若 X 为 可 行 下 降 点 , 即 g,(X*)<0 且 了 CX) 过 ACX'"), 则 用 XX 取代 XX ,构成 新 
的 复合 形 ( 如 图 5-5 中 XW XX XX 四 点 围 成 的 四 边 形 )。 






5-4 非 可 行 点 调 入 可 行 域 
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车 XX 不 满足 可 行 下 降 条 件 , 则 将 a 减 半 , 即 a<=0. 5a, 重 新 计算 为 
基色 ty adsy, Sk, 

直至 XX" 为 可 行 下 降 点 ,用 XX 取代 XX“”, 构 成 新 的 复合 形 。 

如 果 经 过 若干 次 的 a 减 半 操 作 ,a 值 已 经 小 于 一 个 预先 给 定 的 极 小 数 ( 如 10 司 ), 仍 不 能 使 
得 映射 点 优 于 最 坏 点 ,说 明 该 映射 方向 不 好 。 为 了 改变 映射 方向 ,可 找 出 复合 形 各 顶点 中 的 次 
坏 点 , 记 为 X'2 ,有 

(9 : F(X(G ) 一 max( FCXO ) 一 1,2，…,R37 天 琳 } 

用 次 坏 点 X' 2” 替换 最 坏 点 大” ,返回 步骤 (3) 。 

至 此 ,复合 形 完成 一 次 移动 和 收缩 ,<& 十 1, 返 回 步 又 (2) ,进行 下 一 轮 的 迭代 。 

(5) 终止 准则 。 

在 和 迭代 过 程 中 ,复合 形 不 断 移 动 .缩小 并 逐步 向 最 优点 允 近 。 当 复合 形 各 顶点 都 足够 靠近 
最 优点 时 ,就 可 获得 最 优 解 。 此 时 ,各 顶点 的 函数 值 7(X2? ) 与 复合 形 的 中 心 点 于 2 的 函数 值 
f(X" ) 之 差 的 均 方 根 小 于 s, 即 


E 
二 (DY (C) NN2 
于 ) POR te 


加， = 
he )=f(X'°) 


迭代 可 以 结束 ,输出 最 优 解 


其 中 ;XR 一 证 >X” 为 整个 复合 形 的 中 心 。 
复合 形 法 的 程序 框图 如 图 5-6 所 示 。 
例 5-3 用 复合 形 法 求解 约束 优化 问题 
min f(X)= (zi1—3)’+Tzx? 
8 人 8) 一 4 一 好 一 交大 0 
gi (和 ) 一 三 0 
gi(X)=z—0.520 
解 ” 设计 变量 数目 一 2, 故 取 复 合 形 顶 点 数 A 一 2" 一 4,e 一 0. 1。 
(1) 人 为 给 出 4 个 复合 形 顶 点 。 


xm| | x%=| ,|， xzo=| .|， xo=| | 
2 2 3 2.6 


经 检验 ,4 个 顶点 均 在 可 行 域内 。 
(2) 调 优 迭代 ,获得 新 的 复合 形 。 
求 复合 形 项 点 X”、X”、X” 和 XX 的 目标 函数 值 
f XY)=10.25, f(X?)=8, fXHF)=14.76, f(X®)=11.17 
可 以 判断 好 点 大” 和 坏 点 XX 
KD = 和 D6 = 
计算 除 坏 点 X ”外 复合 形 的 形 心 点 X"" 


人 as 


经 检验 于” 在 可 行 域内 。 
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产生 初始 复合 形 的 k 个 顶点 
XN j=1,2,°°,k) 







好 点 久 ,ff(X 中 =min{ (XX ), j=1,2,…,k} 
坏 点 Xf(XE)=max{ f(X), j=1,2,…,k} 





加 史 反射 点 : XO-XOHa (XX ) 


se 


图 5-6 复合 形 法 程序 框图 
取 反 射 系数 a 二 1. 3, 确 定 坏 点 和 ”的 反射 点 X™ 


0.8 0.8] 「0.6 1.06 
xm 一 Xe 二 ee 一 Xeo) 一 | |+1.s(| 上 | ])=| | 
2.2 2.2 3 1. 16 


经 检验 ,反射 点 XX" 在 可 行 域内 。 
因 A(X™) 二 5.1092 过 A(X'”), 故 用 反射 点 XX 替换 X” 构 成 新 的 复合 形 , 其 顶点 为 


C1 = 0.5 (WY = 1 (9) "== 1. 06 ss 0.9 
X ，X ， XX ，X 
2 1.16 2.6 


新 复合 形 顶 点 和 2 、X 2 、X 2 和 2 的 目标 函数 值 为 
f(XV)=10.25, COX2) 王 8， f(XY)=5.1092, f(x)=11.17 
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对 比 判 断 知 :最 坏 点 及 三 昊 1 ,最 好 点 下 ES 
(3) 检验 迭代 终止 条 件 。 
由 于 





,pen — f(RO) .423 > 
不 满足 迭代 终止 条 件 , 需 继续 迭代 。 在 新 的 复合 形 中 重复 上 述 过 程 ,直至 逼近 最 优点 为 止 。 

在 用 直接 法 解决 约束 优化 问题 时 ,复合 形 法 是 一 种 效果 较 好 的 方法 。 这 种 优化 方法 原理 
简单 ,易于 编程 ,不 需要 计算 目标 函数 的 导数 ,也 不 进行 一 维 搜索 ,因此 对 目标 函数 和 约束 条 件 
无 特殊 要 求 , 迭 代 过 程 始 终 在 可 行 域 内 进行 ,运行 结果 可 靠 , 适 用 于 仅 含 不 等 式 约 束 的 问题 ;但 
是 不 适用 于 多 维 , 对 于 多 维 优化 问题 收敛 速度 较 慢 ,初始 复合 形 难 定 ,收敛 精度 低 。 


5.4 惩罚 函数 法 


5.4.1 惩罚 函数 法 概述 


惩罚 函数 法 是 一 种 用 来 求解 约束 优化 问题 的 间接 解法 。 其 基本 思想 是 将 约束 优化 问题 转 
化 为 一 系列 无 约束 优化 问题 来 求解 , 故 又 称 为 序列 无 约束 极 小 化 方法 一 一 SUMT (sequential 
unconstrained minimization technique)。 惩 罚 函 数 法 是 将 约束 水 数 (g, (六) 三 0,h,(XX) = 二 0) 乘 
一 个 可 变化 的 系数 ( 罚 因子 ) 构 成 一 个 惩罚 项 ,再 与 原 目 标 函 数 f(X) 结 合 起 来 构成 一 系列 
的 无 约束 目标 函数 内 X,r) , 称 $8( 针 ,7) 为 惩罚 函数 。 然 后 就 可 以 用 比较 成 熟 的 无 约束 优化 方 
法 求解 &%X,) 的 最 优 解 , 以 这 个 无 约束 最 优 解 来 逼近 原 函 数 FCX) 的 最 优 解 。 据 此 可 知 , 惩 罚 
函数 法 的 关键 问题 是 惩罚 函数 的 构造 。 
根据 惩罚 函数 法 的 基本 思想 ,可 构造 新 的 目标 函数 


$CX,r® ,rh ) 一 100 ti SGCg, O00) tr PH) (5-14) 
式 中 :$8 (X,r ,rm ) 为 惩罚 函数 ; f (XX) 为 原 目 标 函 数 ; jos、r 2 ”都 为 惩罚 因子 ; 
Pos, (X)) 是 不 等 式 约束 惩罚 项 ， DH, (X)) 为 等 式 约 束 惩罚 项 。 
惩罚 项 it 和 惩罚 函数 在 满足 以 下 三 个 极限 性 质 


limz 多 PG.” ) 一 0 
一 1 


lm PH (X®)) =0 Wom 5) 


lim | $CX®Y ,ri ,ro fAXY) |=0 
时 ,惩罚 函数 的 最 优 解 才能 够 逐步 收敛 于 原 函 数 的 最 优 解 。 
根据 惩罚 函数 的 函数 形式 不 同 ,可 将 惩罚 函数 法 分 为 三 种 :外 点 罚 函 数 法 .内 点 罚 函 数 法 
和 混合 点 罚 函数 法 ,分 别 简称 为 外 点 法 、 内 点 法 和 混合 点 法 。 


5.4.2 外 点 罚 函 数 法 
外 点 罚 函 数 法 是 将 罚 函 数 定义 于 可 行 域 之 外 , 即 在 整个 迭代 过 程 中 ,和 迭代 点 是 从 非 可 行 域 
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不 断 向 约束 面 上 的 最 优点 逼近 的 。 
1. 外 点 罚 函 数 的 构 型 
根据 式 (5-1) 的 约束 优化 问题 数学 模型 ,外 点 罚 函 数 可 构造 为 


m 


$(KX,r®) 一 大) 十 re > {max[g, (X) ,0]} (5-16) 


式 中 :%(CX,r%2 ) 为 由 目标 函数 和 约束 函数 所 构造 的 惩罚 函数 ;f(XX) 为 原 目标 函数 ;r= 二 cr 
为 罚 因 子 ( 或 加 权 因 子 ),r* 是 一 个 递增 数列 (0 二 rr 中 过 rr 中 之 7 人 之 之 7 中 之) ,ec 之 1 为 罚 因 
子 递增 系数 ;Z 为 惩罚 指数 ,一 般 取 QZ 一 2。 
如 果 取 
gr(X) go(X) 盖 0 XE92( 在 可 行 域外 ) 
max[ g, (X) 0- 
0 gs(X) 委 0 XEQ9( 在 可 行 域内 ) 


则 罚 函 数 可 表示 为 


E> 十 re Dlg XJ XE 
$(X,r®) = “en (5-17) 
f(X) XED 

式 中 ,了 为 不 满足 约束 条 件 的 集合 , 卫 二 {ulsw>。 4 二 1,2,…,m)。 例 如 有 5 个 约束 , 某 设 计 
点 不 满足 2,3,5 约束 条 件 , 则 了 二 {2,3,5)。 

式 (5-17) 表 明 , 当 设计 点 在 可 行 域内 , 罚 函 数 与 目标 函数 完全 等 价 ; 当 设计 点 选 在 可 行 域 
外 时 ,要 加 上 惩罚 项 。 

2. 惩罚 与 逼近 作用 

罚 函 数 是 通过 对 不 满足 约束 条 件 的 设计 点 进行 惩罚 ,从 而 逐步 逼近 原 函 数 的 最 优 解 的 。 

1) 惩罚 作用 

它 是 通过 惩罚 项 指数 起 作用 的 ,结果 是 使 设计 点 不 得 远离 约束 边界 。 约 束 最 优 解 一 般 位 于 
起 作用 约束 的 边界 上 。 当 ~ 取 某 一 定 值 时 , 若 设计 点 在 非 可 行 域 县 远离 约束 边界 , 则 逢 罚 项 


ro > [gu,(CX) 了 的 值 就 剧 增 , 从 而 引起 惩罚 函数 少 的 值 也 剧 增 , 这 不 符合 数值 迭代 的 下 降 条 件 。 


为 了 保证 迭代 的 继续 进行 ,惩罚 项 开始 起 作用 ,从 而 迫使 设计 点 靠近 起 作用 的 约束 边界 。 

2) 逼近 作用 

它 是 通过 罚 因 子 ”的 不 断 增 大 而 实现 的 ,结果 是 迫使 设计 点 靠近 起 作用 约束 。 当 “一 
co 时 ,只 有 g.(X) 一 0 才能 使 惩罚 项 减 小 ,从 而 使 惩罚 函数 g 减 小 ;这 时 设计 点 就 靠近 了 起 作 
用 约束 ,从 而 获得 了 约束 最 优 解 。 

3. 外 点 法 的 计算 步骤 及 程序 框图 

外 点 罚 函 数 法 的 程序 框图 如 图 5-7 所 示 。 具 体 计 算 步 又 如 下 : 

(1) 选择 适当 的 rx，” 和 c, 规 定 收敛 精度 ei \s: ,规定 障碍 数 尺 。 任 选 初始 点 怀 ”, 且 置 <-0 
( 注 :R 为 预先 设 定 的 一 个 适当 大 的 数 , 当 xr” 碾 R 时 ,说 明 $ 的 极 小 点 与 了 的 极 小 点 还 相差 较 
远 , 不 进行 精度 判断 ,而 直接 开始 下 一 轮 迭 代 ); 

(2) 构造 外 点 罚 函 数 %X,r”) ,利用 无 约束 优化 方法 求 8(X,r” ) 的 极 小 点 立 " (x) 与 极 
小 值 $8(X* ,rx ); 

(3) 计算 XX” (7 ) 违 反 约束 的 最 大 量 :Q 一 maxLg,(X ;7 )], 其 中 工 不 满足 约束 的 集合 ; 


(4) 车 Q 和 se , 则 认为 X” (r”) 在 规定 精度 下 已 位 于 起 作用 约束 面 上 ,停止 欠 代 ,输出 计算 
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给 定 XOrzroel ezcR 





ming(X,r®) 
得 到 X“(r 中 与 $(X ,+r 中 ) 


Q=max {gs(X sr)} 


Y 
= 对 





x“(r®) 
5-7 外 点 罚 函数 法 程序 框图 


结果 ;否则 ,继续 下 一 步 ; 
(5) 检验 罚 因 子 的 值 : 若 r” 放 R, 进 行 步骤 (6) ;车 ”二 RR, 进行 步骤 (7); 
(6) 检验 精度 : 若 上 关 "(r*“”) 一 X" (rx) 之 e, 成 立 , 输 出 计算 结果 ;否则 ,继续 步 又 
(7); 
(7) rt cr ,X= 外 "(7 四 ) ,kk 十 1, 返 回 步 又 (2)。 
例 5-4 用 外 点 罚 函 数 法 求解 约束 优化 问题 
min f(x)=x’ 
s.t. 8g(CZz) 一 Z 十 1] 委 0 
解 ”该 约束 优化 问题 就 是 寻找 f(z) 二 x? 在 可 行 域内 的 极 小 点 。 显 然 , 由 图 5-8 所 示 的 
图 解法 可 知 ， 该 约束 问题 的 最 优 解 :z 三 一 1,JCz" ) 王 1。 
如 何 把 该 问题 转化 为 无 约束 问题 求解 呢 ? 由 图 5-8 可 以 看 出 ,无 约束 优化 的 极 小 点 为 zx? 
二 0, 而 该 点 不 在 可 行 域内 。 所 以 我 们 试 着 将 目标 函数 曲线 f(z) 二 x? 加 以 改造 ,如 图 5-8 所 
示 , 固 定 可 行 域内 的 AB 段 曲线 ,而 将 可 行 域外 部 的 曲线 BC 段 向 上 ( 左 ) 提 ,这 样 ,BC 段 曲 线 
的 极 小 点 x? 就 会 逐步 向 约束 问题 的 最 优点 x 靠近 ,直到 两 点 无 限 接近 为 止 。 如 图 5-9 所 
示 ,AB 段 曲 线 固 定 不 动 ,而 BC 段 曲 线 的 不 断 变 化 使 得 该 段 曲线 的 极 小 值 逐 步 向 xz 逼近 ，。 
改造 后 的 BC 段 曲 线 就 是 我 们 所 要 构造 的 罚 函数 曲线 ,可 表示 为 
$lz,r®) = f(r)+r® DS) {max[Lg, (x) ,0]}’ ro 人 1 让 
0 去 < 妇 一 1 
| 有 
= we we —1 
当 设计 点 在 可 行 域内 时 ,惩罚 项 不 起 作用 , 罚 函 数 $(z,r* ) 就 是 原 目标 函数 
grr®)= f(z)=7’ 
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图 5-8 无 约束 最 优 解 与 约束 最 优 解 的 关系 图 5-9 一 维 约束 优化 的 外 点 法 逼近 过 程 


因此 ,如 果 gzr”) 的 极 小 点 在 可 行 域内 , 则 该 点 必 为 原 问 题 的 最 优 解 。 令 


开 =2z= 0 


很 容易 得 到 极 小 点 
Z" (ro ) 一 0， jz ) 一 gz ) 一 1 
但 是 ,该 点 不 在 可 行 域内 ,从 图 5-8 中 也 可 以 形象 地 看 到 ,点 x (~”)=0 为 非 可 行 点 。 这 说 
明 zx" (r”)==0 不 可 能 是 原 约束 问题 的 最 优 解 。 
如 果 设 计 点 在 可 行 域外 , 则 罚 函 数 为 
prsr® )=zr t+r (rt1)’ 
当 r* 逐渐 变化 时 , 罚 函 数 曲 线 如 图 5-9 所 示 。 可 以 看 到 , 随 着 x” 的 不 断 增 大 , 罚 函 数 的 无 约 
束 极 值 点 就 不 断 向 原 约 束 最 优点 靠近 ; 当 x ”一 co 时 , 罚 函 数 的 无 约束 极 值 点 就 近似 与 原 约束 
最 优点 重合 。 我 们 采用 解析 法 来 验证 。 


令 =2zr+2r" (z+1) =0 

则 罚 函 数 极 值 点 为 
Cr) 一 一 [和 

罚 函 数 的 极 值 为 
$11 ) 二 下 


显然 , 当 "一 co 时 ,z" 一 一 1,g >1。 这 就 证 实 了 当 罚 因子 "一 co 时 , 罚 函 数 的 无 约束 最 优 解 
就 是 原 函 数 的 约束 最 优 解 , 同 时 也 证 实 了 通过 构造 罚 函 数 ,可 将 约束 优化 问题 转化 为 一 系列 无 约 
束 优化 问题 。 通 过 罚 因子 ”2 的 不 断 变化 ,系列 无 约束 最 优 解 能 够 通 近 原 约 束 问 题 的 最 优 解 。 

例 5-4 是 一 个 一 维 的 约束 优化 问题 ,对 于 多 维 问题 ,也 
可 以 用 类 似 的 方法 来 求解 。 

例 5-5 用 外 点 罚 函 数 法 求解 约束 优化 问题 

min f(¥X)=zxi 二 zi—zxirzs—10ri—4zx:+60 
% t. g(X)=zi 二 zx:—8<0 

解 ”目标 函数 等 值 线 和 可 行 域 如 图 5-10 所 示 。 可 以 看 

出 ,该 约束 优化 问题 的 最 优 解 为 





x…=| -|， f(X' )=17 


5-10 图 解法 的 约束 最 优 解 
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下 面 我 们 通过 构造 一 个 外 罚 函 数 且 对 其 进行 解析 运算 ,来 验证 当 x” 一 co 时 ,外 罚 函 数 的 
最 优 解 趋 于 原 目 标 函 数 的 最 优 解 。 
构造 外 罚 函 数 
r= 十 r DD) {max[g, (X) ,0])? 
y 2 zirT—l0r CO—4rs+60+r oCB+r—8) glX)S0 
wh Banoo g(X) 生 0 
如 果 设 计 点 选 在 可 行 域内 , 则 原 函 数 与 罚 函 数 相等 , 即 
大 357 三) 二 邓 才 码 一 Xi 一 102 二 zz 寺 O 
令 其 一 阶 偏 导数 分 别 等 于 零 , 即 








9 一 27zl 一 了 一 10 一 0 
DZl 

a =27xs — Zi 一 4 一 0 
DZz 


解 方程 组 可 得 :XX* = 二 [8 6]',f(X" ) 二 $8(X" ) 二 8。 但 由 于 该 点 不 在 可 行 域内 , 故 X" = 
[8 6 天 不 是 原 约束 问题 的 最 优 解 。 
如 果 设 计 点 选 在 可 行 域外 , 则 罚 函 数 为 
并 下 ,7 外 7) 三 好 十 好 一 zz 一 10z 一 4zz 十 60 十 rz 十 zy 一 873 
当 rr” 逐渐 变化 时 , 罚 函 数 曲 线 的 变化 如 图 5-11 所 示 。 





$(X,0.3) 





AX) 
(a) 





(c) 


图 5-11 二 维 约束 问题 的 外 点 法 逼近 过 程 
(a) r 心 一 0. 3 的 罚 函 数 曲 线 。 (b)r 咏 二 1.0 的 罚 函 数 曲 线 《〈c) rr 三 10 的 罚 函 数 曲 线 
可 以 看 到 , 随 着 xr” 的 不 断 增 大 , 罚 函 数 曲 线 的 无 约束 极 值 点 就 不 断 向 原 约 束 最 优点 靠 
近 ; 当 wx” 一 co 时 , 罚 函 数 曲线 的 无 约束 极 值 点 就 与 原 约束 最 优点 重合 。 双 近 过 程 可 用 解析 法 
验证 。 


令 
a —zs—10 二 272(ri+z 8)=0 
DZi 
2 一 27; 一 zi 一 4 十 2rb (zi 十 zz 一 8) 一 0 
zz 
联 立 求解 得 到 
外 
1 dr 二 1” 4r 中 十 1 


当 rw 一 co 时 ,得 
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ZI 一 5， X23 


故 所 求 得 的 最 优 解 为 
ze 一 | FR" )=17 
3 


一 维 约束 问题 和 二 维 约束 问题 的 结论 同样 也 适用 于 多 维 约束 优化 问题 。 通 过 构造 罚 函 
数 , 可 将 约束 优化 问题 转化 为 一 系列 无 约束 优化 问题 ,然后 调用 无 约束 优化 方法 来 进行 求解 。 
通过 罚 因 子 ”的 不 断 变化 ,系列 无 约束 最 优 解 最 后 逼近 原 约束 问题 的 最 优 解 。 

4. 外 点 法 使 用 中 的 几 个 问题 

(1) 罚 因子 的 初 值 r” 及 递增 系数 c 的 选择 。 

罚 因 子 初 值 ”的 选择 是 否 恰当 ,对 优化 过 程 的 顺利 进行 有 很 大 影响 。r'” 选 得 大 ,收敛 
速度 应 快 些 ,但 罚 函 数 可 能 会 出 现 畸 形 ,从 而 导致 寻 优 失败 ;rW” 选 得 小 ,迭代 次 数 多 ,但 寻 优 成 
功 的 可 能 性 大 。 实 际 使 用 时 ,可 以 从 较 小 的 值 如 10“ 开 始 试 选 几 个 +r" 。 

Weisman 曾 建 议 ~ 所 按 下 式 选 取 , 即 

0 = 0. 02 
mg CR FR) 

式 (5-18) 对 于 每 一 个 约束 函数 都 有 一 个 罚 因子 ,可 取 其 最 小 值 。 罚 因子 是 一 个 递增 序 
列 ,r* 三 cr。 一 般 来 说 ,递增 系数 c 对 寻 优 成 败 影响 不 大 ,一 般 取 c 王 5 一 10。 

(2) 初始 点 X"” 的 选择 。 

对 于 外 点 法 来 说 ,原则 上 X” 可 以 任意 选取 ,而 且 不 论 X” 是 否 位 于 可 行 域 , 罚 函 数 
YX,rw% ) 的 极 值 点 均 在 可 行 域外 。 

(3) 约束 裕 量 。 

外 点 法 是 在 非 可 行 域内 进行 寻 优 的 , 即 所 有 迭代 点 均 为 非 可 行 点 。 严 格 来 讲 , 其 最 优点 
X" 也 是 靠近 起 作用 约束 的 非 可 行 点 。 为 使 最 优点 为 可 行 点 ,可 将 每 个 约束 都 加 上 一 个 裕 量 6 
(一 般 取 8$ 王 10 一 10 一 ) , 即 

8 (X) 一 go(X) 十 96 委 0 (zx 一 1,2，…y772) 





(u=1,2,",m) (5-18) 


(4) 尺度 问题 。 

在 外 罚 函 数 法 的 寻 优 过 程 中 ,如 果 各 约束 函数 的 取 值 的 数量 级 相差 太 大 , 则 它们 的 惩罚 作 
用 就 会 有 显著 的 差异 。 数 量 级 大 的 约束 就 会 优先 得 到 满足 ,而 数量 级 较 小 的 约束 有 可 能 会 得 
不 到 满足 , 即 最 优点 靠 不 上 起 作用 约束 。 为 克服 这 一 缺点 ,可 采用 两 方面 的 措施 。 

Q@ 对 每 个 约束 条 件 ,采用 一 个 罚 因子 , 即 惩罚 项 表示 为 


Sur Le ,0 
u=1 


rr 按 式 (5-18)Weisman 的 建议 来 确定 。 
@ 采用 相对 量 作为 约束 条 件 。 例 如 ,对 约束 条 件 :强度 c 和 [cc] , 挠 度 FL 门 , 相 对 约束 条 
件 可 写 为 


5 [ol<0—>g = 0 


gi—=f—[Lfj<0~>g: -而 -< 


(5) 外 罚 函 数 法 能 够 处 理 具有 等 式 约束 的 问题 。 
由 于 外 罚 函 数 法 能 够 从 可 行 域 之 外 使 设计 点 靠 上 起 作用 的 约束 。 而 我 们 知道 ,任何 等 式 
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约束 都 应 是 起 作用 约束 ,所 以 外 罚 函 数 法 能 够 处 理 具 有 等 式 约 束 的 约束 问题 。 
对 于 约束 优化 问题 式 (5-1), 罚 函数 的 表达 式 为 


' m p 
多 (和 7 ) 一 FX) 十 r D> {maxLg. (X) ,0 +r® DLh, XJ (5-19) 
v=1 


u=1 


其 中 ,r= 二 cr* ?同样 为 递增 的 罚 因子 。 
(6) 当 取 g,(X) 三 0 时 , 取 


$CKX,r®) 一 大) 十 7 D>) {minLg, (X) ,0)? (5-20) 
u=1 


5.4.3 ”内 点 罚 函 数 法 


内 点 罚 函 数 法 就 是 将 罚 函 数 #XX,7) 定 义 于 可 行 域 之 内 , 即 整个 寻 优 过 程 是 在 可 行 域内 进 
行 的 , 它 的 初始 点 导 ” .和 迭代 点 天 ” 终止 点 天" 也 都 是 可 行 点 。 内 点 法 只 能 求解 具有 不 等 式 约 
束 的 优化 问题 。 

1. 内 点 罚 函 数 的 构 型 


m 


1 


(k) Ss A) = 
$CX,r®) = F(X)—r 之 EE (5-21) 
或 
gz) = fCX)—r® Dln[— g,(X)] (5-22) 
4& 一] 


式 中 :r= 二 cr*? 为 内 罚 因子 , 它 是 一 个 递减 序列 (rr 中 二 r 中 二 fr 二 之 r 中 之 … 放 0) yc 为 内 
罚 因子 的 递减 系数 。 

2. 惩罚 与 逼近 作用 

1) 惩罚 作用 

它 是 靠 惩罚 项 起 作用 而 实现 的 ,其 结果 是 阻挡 设计 点 不 能 越 出 可 行 域 。 当 迭代 点 在 可 


行 域内 距离 约束 边界 较 远 时 ,其 惩罚 项 (一 一 交 ) 是 不 大 的 正 值 ; 而 当选 代 点 X 在 可 行 域内 


向 约束 边界 (g,CX) 一 0) 处 移动 并 靠近 时 ,其 惩罚 项 的 值 ( 一 ) 独 增 ( 具 有 很 大 的 正 值 )， 


从 而 引起 $8(XX,7) 的 值 也 猛 增 ,并 且 越 靠近 边界 ,其 值 趋 于 无 穷 大 。 因 此 ,惩罚 项 就 像 在 约束 边 
界 上 筑 起 了 一 道 "高 墙 5>, 阻 止 适 代 点 靠近 约束 边界 ,从 而 也 不 会 越 出 边界 ,使 设计 点 始终 在 可 
行 域内 。 

2) 和 逼近 作用 

约束 最 优点 总 是 位 于 起 作用 约束 的 边界 上 ,在 惩罚 的 前 提 下 ,如 何 使 设计 点 最 终 靠 上 起 作 
用 约束 ,从 而 盘 近 原 目标 函数 F(X) 的 最 优 解 呢 ? 这 是 通过 罚 因 子 的 逼近 作用 而 实现 的 。 随 
着 罚 因 子 ~” 的 不 断 递减 ,使 惩罚 项 的 作用 不 断 减弱 ,最 终 使 得 罚 函 数 的 最 优 解 靠近 起 作用 
约束 。 

3. 内 点 法 的 计算 步骤 及 程序 框图 

内 点 法 的 程序 框图 如 图 5-12 所 示 。 内 点 法 的 具体 计算 步骤 如 下 。 

(1) 选取 可 行 初始 点 X”。 

(2) 选取 适当 的 罚 因 子 初 值 ~” ,规定 收敛 精度 61 、e; ,决定 障碍 数 RR 和 递减 系数 c, 上 且 置 
二 0( 注 :R 为 预先 设 定 的 一 个 适当 小 的 数 , 当 rr* 放 R 时 ,说 明 $ 的 极 小 点 与 的 极 小 点 还 相差 


第 5 章 ”约束 优化 方法 。 93 。 












min$(X,r®) 
得 到 X“(r 中 ) 与 $(X ,中 ) 
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图 5-12 内 点 法 程序 框图 


较 远 ,不 进行 精度 判断 ,而 直接 开始 下 一 轮 迭 代 )。 
(3) 构造 内 罚 函 数 $( 针 ,x”), 调 用 无 约束 优化 方法 子 程序 求 ming(¥X,r'™ ,得 XX" (WY, 
(4) 检验 罚 因子 的 值 。 若 和民 ,进行 步骤 (5); 和 否则 ,进行 步骤 (6) 。 
(5) 检验 精度 。 
| | X" (Fn ss (re ) | <el "= 多" (r'*) 


二 。。 成 立 ,输出 最 优 解 (xy. ) px: Cr )) 否则 进行 下 


me = 








pn 

一 步 。 

(6) rtD 二 cr ,关中 二 和 "(xr 中 ) ,< 十 1, 返 回 步骤 (3) 。 

例 5-6 用 内 点 罚 函 数 法 求解 约束 优化 问题 
min Fz) 一 工 
s.t。&g(Cz) 一 Z 十 1] 委 0 

解 ”由 外 点 法 求解 可 知 , 该 优化 问题 的 最 优 解 为 

五 "一 一 1， f(x")=1 

下 面 我 们 通过 构造 一 个 内 罚 函 数 且 对 其 进行 解析 运算 ,来 验证 随 着 r* 的 不 断 减 小 ,#$ 的 
无 约束 最 优 解 趋 于 了 的 约束 最 优 解 。 

构造 内 罚 函 数 





$l(rr® =f xr) —r no— g(x)] 
-TInt =1> 
当 rr" 逐渐 变化 时 , 罚 函 数 曲线 如 图 5-13 所 示 。 
可 以 看 到 , 随 着 ”的 不 断 减 小 , 罚 函 数 的 无 约束 极 值 点 就 不 断 向 原 约 束 最 优点 靠近 ; 当 
r”-~0 时 , 罚 函 数 的 无 约束 极 值 点 就 与 原 约束 最 优点 重合 。 下 面 通 过 解析 法 进行 验证 ， 
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3ag_ 一 (月 ] 2 
人 tT 
求解 得 到 惩罚 函数 的 极 值 点 为 





Zr (rm) 一 一 二 一元 VIT27F 
可 以 看 到 , 当 > 和 一 0 时 ,z (rr 全) 一 一 1 一 工 。 


由 此 可 见 , 随 着 ”的 不 断 减 小 ,内 罚 函 数 的 无 约束 


最 优 解 最 终 趋 于 原 问 题 的 约束 最 优 解 。 
例 5-7 用 内 点 罚 函数 法 求解 约束 优化 问题 


图 5-13 一 维 约束 优化 的 内 点 法 逼近 过 程 


min 丰 (X) 王 zi 十 好 一 2 过 一 I0z 一 4zz 十 60 
和 g(¥X)=Zz 十 Xs 一 8 二 0 





解 ”由 外 点 法 求解 可 知 , 该 优化 问题 的 最 优 解 为 
| fCX* )=17 
3 
构造 内 罚 函 数 
$CX,r®) = fCX) rt 
当 ~” 逐 渐变 化 时 , 罚 函 数 曲 线 如 图 5-14 所 示 。 





(a) 





图 5-14 二 维 约束 优 化 的 内 点 法 和 逼近 过 程 
(a) r 一 50 的 惩罚 函数 曲线 〈b) r= 二 1.0 的 惩罚 函数 曲线 
令 
,Es 
3zi 2zi 2 10 十 去 十 xz 一 8)5 0 
RE 
Ck Zr 人 SR m=" a 
联 立 求解 得 到 
3 一 9 二 2 到 9 一 V9 十 2r 史 
DD 3 


2 
当 x* 一 0 时 ,得 
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故 所 求 得 的 最 优 解 为 
X" -| f(X"* ) 一 17 
3 


4. 内 点 法 使 用 中 的 几 个 问题 

(1) 初始 点 X” 的 选择 。 

由 于 内 点 罚 函 数 法 是 在 可 行 域内 寻 优 的 , 即 它 的 所 有 和 迭代 都 必须 是 可 行 点 ,所 以 要 求 初始 
点 应 为 一 个 严格 可 行 点 ( 即 g,(X” ) 二 0,u 二 1,2,…,m), 且 X” 最 好 远离 约束 边界 。 这 对 寻 
优 过 程 的 顺利 进行 十 分 有 利 。 对 于 维 数 低 , 约 束 函 数 简单 的 优化 问题 ,可 直接 人 工 选取 可 行 初 
始点 XX” ;但 对 设计 变量 多 ,约束 函数 复杂 的 开发 性 设计 来 说 ,要 找到 一 个 严格 可 行 的 初始 点 
是 有 一 定 难 度 的 。 此 时 可 采用 随机 法 选择 初始 点 XX"” 。 

准确 确定 各 设计 变量 的 上 下 限 [a; ,6;] 后 ,初始 点 X 的 各 分 量 表示 为 

Xi=a; 二 rbi—ai) (i=1,2,.,n) 

其 中 ,为 区 间 [0,1] 上 均匀 分 布 的 随机 数 。 

(2) 罚 因 子 初 值 ”的 选择 。 

r" 与 罚 函 数 法 的 收敛 速度 、 收 敛 精度 甚至 寻 优 的 成 败 都 有 很 大 关系 。 一 般 来 说 ,r” 取得 
小 ,收敛 快 ,但 罚 函 数 性 态 坏 (函数 曲线 陡 ) ,不 易 寻 优 ;r'” 取 得 大 ,收敛 慢 , 但 罚 函数 性 态 好 ( 函 
数 曲线 平缓 )。 

实际 使 用 时 ,可 选 几 个 rx" 值 试用 一 下 ,对 不 同 的 问题 找 出 与 之 适应 的 x” ,再 则 也 可 按 下 
式 定 x” , 即 

Pa. S| 


m 1 
>， Be CK ) 


2 一 1 


上 式 即 在 初始 点 X "附近 ,目标 函数 项 及 惩罚 项 平分 秋色 ,都 不 占据 主宰 地 位 。 
(3) 罚 因子 递减 系数 c 的 选择 。 
内 罚 因子 是 一 个 递减 数列 ,c 对 罚 函 数值 的 成 败 影响 不 大 ,一 般 取 c 王 0. 02 一 0. 1。 
(4) 内 罚 函 数 法 不 能 解决 含有 等 式 约 束 的 优化 问题 。 
(5) 当 约 束 的 形式 为 g,(X) 宇 0 时 , 罚 函 数 的 表达 式 应 为 


m 


1 
cs (k) 
$(X,r) = fCX)++r 之 0 


(6) 内 点 罚 函 数 法 是 在 可 行 域内 寻 优 的 , 它 的 所 有 和 迭代 点 都 是 可 行 点 , 即 可 行 的 设计 方 
案 。 用 户 可 从 一 系列 可 行 方案 中 任 选 一 个 合适 的 方案 ,不 一 定 选 用 最 终 (最 优 ) 方 案 。 


5.4.4 混合 点 罚 函 数 法 


混合 点 罚 函 数 法 就 是 将 内 点 法 与 外 点 法 结合 在 一 起 的 罚 函数 法 。 内 点 法 的 所 有 迭代 点 都 
是 可 行 点 (可 行 方案 ) ,而 外 点 法 又 能 够 处 理 具有 等 式 约束 与 不 等 式 约束 的 优化 问题 。 
对 于 式 (5-1) 的 数学 模型 ,混合 点 罚 函 数 法 的 构 型 为 
(DY (有 上 1 2 
$CX,7®) = fCX) 一 2 ED + i] (5-23) 


u=1 











1 La 3 i ey 
式 中 +% 7 二 06 为 内 点 罚 项 :天 寺 [4vC0] 为 外 点 罚 项 。r” 一 cr* "为 昼 因子 ,是 一 
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个 递减 序列 (ro 之 >r 之 >>r 过 >>0)。 
对 于 g,(X) 三 0, 取 


KY = (k) 1 1 S 2 到 
#CXre) = FCX) 十 > 2 FD + FLX] (5-24) 


u==1 





混合 点 罚 函 数 法 是 在 内 点 法 的 基础 上 增加 了 一 次 等 式 约束 惩罚 项 而 构成 的 ,因此 它 的 
计算 步 又、 程序 框图 及 使 用 应 注意 的 问题 与 内 点 法 相同 。 混 合 点 罚 函 数 法 能 够 处 理 具有 等 
式 与 不 等 式 约束 的 优化 问题 ,还 可 以 用 来 求解 非 线 性 方程 组 ,所 以 在 工程 领域 有 很 大 的 实 
用 价值 。 

混合 点 罚 函 数 法 使 用 较为 普遍 ,已 解决 了 大 量 的 工程 实际 问题 , 它 对 一 般 中 小 型 工程 优化 
问题 都 很 有 效 。 其 优点 是 可 处 理 具 有 等 式 与 不 等 式 约 东 的 优化 问题 ,适用 范围 广 ,、 使 用 方便 ; 
其 缺点 是 计算 量 大 (序列 无 约束 优化 ),r” 对 收敛 速度 及 是 否 成 功 影响 大 。 


习 题 


5-1 用 可 行 方向 法 求解 下 面 约束 优化 问题 
min f(X)=9xi9zxi — 30ri—72x, 
s.t. g1( 关 )=2zx1 十 zx; 一 4 寺 0 
g2(X)=—Zzi<0 
8g3( 避 ) 一 一 Z 委 0 
取 初 始 可 行 点 X" 一 L0 0]' ,收敛 精度 s 一 0.01。 
5-2 设 约束 优化 问题 的 数学 模型 为 
min f(X)=1—2zx—zx? 
s.t. g1( 尖 ) 二 x 十 Xs 一 6 志 0 
g2(¥X)=—zx0 
gi (下 ) 一 一 zz<0 
选取 可 行 初始 点 头 “ 二 [3 11]' ,用 两 个 随机 数 ri 一 一 0.1,r 吕 一 0. 85 构造 随机 方向 
S” ,并 活该 方向 取 步 长 we 一 2, 计 算 各 试验 点 ,确定 最 后 一 个 适用 可 行 点 辟 "”，, 并 画 出 
图 形 。 
5-3 ”已 知 约 束 优 化 问题 
min f(X)= (zi 二 20)’ 二 (xz; 十 20)? 
s.t. g1(X¥X)=—z1—30<0 
(= 二 三 次 一 各 者 
gs(X)=—zs—30<0 
gi(X)=zxi 二 zi—6400<0 
试 利用 复合 形 法 五 个 复合 形 ( 不 包括 初始 复合 形 ) 的 搜索 过 程 ,确定 最 后 获得 的 最 优点 
位 置 。 选 定 初始 复合 形 顶 点 慎 三 [一 10 65] ,X= 二 [65 40]', 关 二 [50 ”10]7, 映 
射 系数 a 二 1。 
5-4 试 分 别 构造 如 下 约束 优化 问题 的 外 点 罚 函 数 和 内 点 罚 函 数 
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s.t. g(X)=1—zx<0 

5-5 用 外 点 罚 函 数 法 或 混合 点 罚 函 数 法 求解 以 下 约束 问题 的 最 优 解 
min 三 (X) 一 寻 十 2z2 一 ZizZz 一 ZI 一 1072 

ci | t，8g1 (下 ) 一 3zl 十 2z 一 6 委 0 
g2(X)=—zi0 
g3(¥X)=—zx,<0 

min f(X)=x’ 

a | t. g1(X)=—zx—2&0 
g2(X)=zx—2<0 
hi(X)=zx—1=0 

min F(X) 一 zi 十 z 一 10zi 一 16zz 十 89 
s.t，g1(X) 一 Zi 一 10 委 0 
gz(X) 王 一 zz 十 1 委 0 
ga ( 避 ) 一 zz 一 10 委 0 
g4(X) 一 一 Zi 十 zz 一 1] 委 0 
hi( 半 )= 一 zl 十 xX; 二 0 
min f(X)=zx? 二 zi 二 zx 十 2x174 XT2Xa 
6 | t，2() 一 一 如 十 2 一 已 十 8<0 
gz (下 ) 王 一 2 一 Zi 一 1] 委 0 
hi(¥)=2z1 十 Xs 一 6 二 0 
5-6 用 内 点 罚 函 数 法 求解 以 下 约束 问题 的 最 优 解 
min f(X)=zxi++4zi 
s. t，8g1(X) 一 3zl 十 4z 之 13 
min f(X)=zi+zxs 
(2) | 


(1) 


s.t, gi(X)=zxi— zs0 
gi(X)=—zxi<0 

min f(X)=zx’?++zxi—27ri7zs —271—67ze 

s.t. g1(%)=z 二 Xz; 一 20 
Bi(¥)=—xi 二 27z;—2<0 
g3(X)=—z<0 
gi(X)=—zx,<0 


r 100=Cm -D+ (zs—3) 


2 


2 
s.t，gI1(X) 一 Zi 一 2z 十 2 过 0 
gz(X) 一 一 zi 一 2zz 十 6 之 0 
ga(X)=—zx1<0 
gi(¥)=—zxs<0 


(4) 
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6.1 线性 规划 方法 


目标 函数 和 约束 函数 都 是 线性 函数 的 最 优化 问题 称 为 线性 规划 问题 ,对 应 的 算法 称 为 线 
性 规划 算法 。 线 性 规划 问题 相对 于 非 线性 最 优化 问题 比较 简单 ,其 算法 也 最 为 成 熟 。 生 产 计 
划 、 经 济 管理 .系统 工程 等 领域 的 问题 一 般 属于 线性 规划 问题 ,如 加 工 车 间 的 生产 调度 问题 , 因 
此 线性 规划 算法 在 这 些 领 域 得 到 广泛 应 用 。 本 节 介 绍 线性 规划 的 基本 概念 和 单纯 形 法 。 


6.1.1 线性 规划 问题 的 一 般 形式 


线性 规划 问题 的 数学 模型 同样 由 设计 变量 .目标 函数 和 约束 条 件 组 成 ,其 约束 条 件 一 般 包 
括 等 式 约 束 和 设计 变量 非 负 约束 两 部 分 。 因 此 线性 规划 问题 的 一 般 形式 为 
niin 了 (和 ) 一 cizi 十 czzz 十 … 十 cuezs 
s.t. g1 (KX)=anzitawvzst az, —=b 
gi1(¥X)=aviziTazszrst 十 Tarr, = bs 
(6-1) 
gm (KX)=aniTicTan Tt Tamr, = bb 
Ty rT TiO0 


也 可 以 写成 如 下 求 和 的 形式 


min f/(X) = Dciz, 
i=1 


5 Ep 
i=1 
0 Oe ly) 
还 可 以 写成 如 下 向 量 形式 
min f(X)=C'X 
| t. AX=B (6-3) 
Xi 宇 0 (1=1,2,°",n) 
式 中 : 
下 二 [zi ze ds C=[e ee we cj 


QI Ql? pt Qin 
Q21 dz2 “” CQzn 


1 和 


A 称 为 系数 矩阵 ;4X 一 了 称 为 约束 方程 ,B 称 为 常数 向 量 ,z, 宇 0 称 为 变量 非 负 约束 。 
一 般 情况 下 ,应 有 x 二 n。 因 为 只 有 当 mn 时 ,约束 方程 才 有 许多 组 解 , 线 性 规划 问题 的 
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目的 就 是 要 从 这 许多 组 解 中 找到 使 目标 函数 取得 最 小 值 的 最 优 解 。 

在 线性 规划 问题 的 数学 模型 中 , 除 变量 非 负 约束 是 不 等 式 约束 外 ,其 他 约束 条 件 均 应 是 等 
式 约束 。 如 果 还 有 其 他 形式 的 不 等 式 约束 , 则 可 以 通过 引入 松弛 变量 的 方法 将 其 转化 为 等 式 
约束 。 


6. 1.2 解 的 产生 与 转换 


1. 基本 解 的 产生 与 转换 

在 约束 方程 中 , 若 令 n 一 m 个 变量 为 零 ,就 可 求 得 男 外 m 个 不 全 为 零 的 变量 。 于 是 这 m 
个 不 全 为 零 的 变量 和 一 m 个 为 零 的 变量 共同 组 成 一 个 解 向 量 , 称 为 线性 规划 问题 的 基本 解 。 
其 中 nw 个 不 全 为 零 的 变量 称 为 基本 变量 ,其 余 n 一 m 个 为 零 的 变量 称 为 非 基 本 变量 。 

可 见 ,每 取 n 一 m 个 变量 并 令 其 等 于 零 , 解 出 男 外 的 m 个 不 为 零 的 变量 ,就 可 得 到 一 个 基 
本 解 。 于 是 ,一 个 线性 规划 问题 的 基本 解 的 个 数 可 以 由 排列 组 合 运算 得 到 , 即 


nl 


i (nO—m)! (6-4 
把 约束 方程 中 的 系数 和 矩阵 A 和 常数 向 量 B 合并 组 成 增 广 矩阵 , 即 
all CI12 “i 
CQ21 U22 azn b2 
Uml Um2 Se CG pm bi 
并 对 此 增 广 和 矩阵 进行 一 系列 初等 行 变 换 ,车 将 前 m 行 m 列 变 成 一 个 单位 矩阵 , 即 
1 0 Se 0 i ~ a 六 
0 sp Or re Qs Be 
(6-5) 
0 © a TD Ba a b” 
并 令 其 中 从 za 到 的 n 一 m 个 变量 为 非 基 本 变量 ,其 值 为 零 , 则 由 约束 方程 
Xl 
/ / | Xz / 
1 0 as 0 i = bi 
0 1 2 0 Uzimt!l Sn a zy 0 
wn | 三 | (6-6) 
/ / Tmtl 7 
0 0 … 1 ao oa - 六 
Th 





可 得 到 对 应 线性 规划 问题 的 一 个 基本 解 , 即 
XO=[6 bs pb 0 … 0 

要 实现 上 述 矩 阵 的 变换 ,需要 对 增 广 矩 阵 进行 高 斯 消 元 变换 ,进行 一 次 消 元 变换 的 步骤 
如 下 。 

(1) 选 定 一 个 想 要 变 为 1 的 矩阵 元 素 wx , 称 为 变换 主 元 。 下 标 ! 代表 主 元 所 在 的 行 , 称 为 
主 元 行 ;下 标 上 代表 主 元 所 在 的 列 , 称 为 主 元 列 。 

(2) 把 主 元 行 的 各 个 元 素 分 别 除 以 主 元 cu ;将 主 元 变 为 1, 即 cx 一 1。 

(3) 用 初等 行 变 换 把 主 元 列 中 除 主 元 以 外 的 其 他 元 素 变 为 零 。 
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消 元 变换 的 基本 计算 公式 如 下 : 
d= (i=D) 
Qk 
as 一 ay 一 ao (i 尖 人 
如 = 二 Gi=D 6 
adl,k 
i Gi#D) 


(i=1,2,°% ,m3j=1,2," ,n) 

综 上 所 述 ,对 增 广 和 矩阵 进行 m 次 消 元 变换 后 ,就 可 得 到 一 个 基本 解 。 如 果 想 得 到 男 一 个 
基本 解 , 实 现 基本 人 解 之 间 的 转换 ,需要 将 增 广 和 矩阵 中 非 基 本 变量 所 对 应 的 诸多 元 素 中 的 一 个 作 
为 新 的 主 元 再 进行 一 次 消 元 变换 即 可 。 

如 在 式 (6-5) 中 ,选取 a:.。+ 作 为 新 的 主 元 ,进行 一 次 消 元 变换 后 得 到 


1 

0 az 0 2 0 (1) ac ac bs 

0 a 1 … 0 0 dts i Qs 

0 a OO oe 0 dunte Am Ds 
对 应 的 基本 解 为 

0 一 [的 0 的 bb, bs 0 » 0] 


与 基本 解 X" 不 同 的 是 ,原来 的 基本 变量 z* 变 成 了 非 基 本 变量 ,而 原来 的 非 基 本 变量 zw+ 变 
成 了 基本 变量 ,因此 这 种 变换 实际 上 是 一 种 非 基 本 变量 与 基本 变量 的 转换 。 若 构成 基本 解 的 
基本 变量 均 为 非 负 值 , 即 刀 宇 0, 则 此 基本 解 也 是 一 个 基本 可 行 解 。 
2. 基本 可 行 解 的 产生 与 转换 
基本 可 行 解 是 同时 满足 约束 方程 和 变量 非 负 约束 的 解 ,最 优 解 存在 于 基本 可 行 解 之 中 。 
如 果 能 够 找到 求解 初始 基本 可 行 解 的 方法 和 基本 可 行 解 之 间 的 变换 方法 ,那么 得 到 最 优 解 的 
过 程 将 会 更 直接 、 更 迅速 。 
(1) 当 约 束 为 不 等 式 约束 ,而 且 常 数 向 量 均 大 于 零 时 ,只 要 引入 松 弛 变量 ,并 以 松弛 变量 
为 基本 变量 ,就 可 以 得 到 一 个 初始 基本 可 行 解 。 
例如 ,对 于 如 下 约束 条 件 
Xi 一 wz 十 Xa 寺 4 
Twit2m— ra 
ZX1 XT2 9T3 之 0 
引入 松弛 变量 z, 和 zs 后 变 为 
Zi 一 Zz 十 Zs 十 元 一 4 
Xi 十 2Xs 一 X3 十 Xs 二 8 
TiyZzy…wyZ5 过 0 


对 应 的 增 广 和 矩阵 为 
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由 此 ,得 到 基本 可 行 解 
X"*=[0 0 0 4 8]' 

(2) 如 果 约 束 方程 的 常数 向 量 中 有 负数 存在 ,或 者 除 变量 非 负 约束 外 的 约束 条 件 中 还 包 
会 等 式 约束 ,此 时 可 在 目标 函数 中 引入 人 工 变 量 , 形 成 辅助 规划 问题 并 加 以 变换 得 到 一 个 初始 
基本 可 行 解 。 辅 助 规划 问题 的 目标 函数 取 各 个 人 工 变量 之 和 ,约束 方程 为 引 人 人 工 变量 后 的 
等 式 约束 ,以 及 包括 人 工 变 量 在 内 的 变量 非 负 约束 。 

例如 ,线性 规划 问题 

min f(X)=zi 二 zx 
st 5zi 十 4zz 十 13x5 一 2 十 zx 一 30 
zl 十 zz 十 5zs 一 2 十 z5 一 8 
bE 710 
引入 人 工 变 量 x 和 xz; 后 ,建立 的 辅助 规划 问题 为 
min D(X)=zst Zz; 
Ss.t, Sz Td4z2 lim?n nt ws = 30 
i 让 525 一 各 十 36 不 Xn 二 28 
X19T2 3" XT1 >0 

对 该 辅助 问题 进行 消 元 变换 , 当 辅 助 问题 的 目标 函数 的 值 等 于 零 时 ,所 得 的 解 中 ,除去 人 
工 变量 的 其 余部 分 就 是 原 线性 规划 问题 的 一 个 初始 基本 可 行 解 。 

由 于 基本 可 行 解 是 基本 解 的 一 部 分 , 故 基本 可 行 解 之 间 的 相互 转换 仍然 采用 消 元 变换 。 
为 了 保证 变换 后 的 解 也 是 基本 可 行 解 ,并 且 尽 快 得 到 线性 规划 问题 的 最 优 解 ,必须 解决 以 下 两 
个 问题 : 

(1) 变换 后 的 基本 解 仍 是 基本 可 行 解 , 即 有 


久之 0 (i=1,2,°",m) (6-8) 
此 式 称 非 负 性 条 件 。 
(2) 变换 后 的 目标 函数 应 有 最 大 的 下 降 , 即 
F(X I = max (6-9) 
此 式 称 最 优 性 条 件 。 
6.1.3 基本 可 行 解 转换 的 条 件 
1. 非 负 性 条 件 
可 以 看 出 , 若 变换 前 的 解 是 一 个 基本 可 行 解 , 则 由 公式 (6-7) 可 知 ,变换 后 的 常数 项 应 满足 
/ bi 二 
,一 一 人 0 (i=0) 


b=b,—ai >0 (i 二 1,2," ,ms;i 关 人 ) 
tk 


为 此 ,必须 使 a4>0, 并 且 有 二 -之 2 由 此 可 知 , 只 要 按 下 式 选 取 主 元 


i 
BE 本 
一 -一 min 7 lant>0 (i=1,2,,m) (6-10) 
i 不 


并 进行 消 元 变换 就 可 以 保证 变换 后 的 常数 项 仍 为 非 负 ,也 就 是 说 保证 由 一 个 基本 可 行 解 变换 
得 到 的 解 仍 然 是 基本 可 行 解 。 


» 102 。 机 械 优 化 设计 


2. 最 优 性 条 件 
将 目标 函数 写成 下 面 的 形式 


f/f(X) = Ss 村 Cy (6-11) 
式 中 :zi 为 基本 变量 ;z 为 非 基 本 变量 。 
将 基本 变量 用 非 基 本 变量 表示 , 即 


Ti=b— Pasr; (= 1,2,%,m) (6-12) 
并 代入 式 (6-11) 得 


f(X) = pa = 一 本 过 cjx; 一 Pp py [6 一 Sa kz; (6-13) 
i=1 j=m+l j=mt+l i=1 j=m+1 i=1 


式 中 : > cp, 是 变换 前 目标 函数 的 值 。 


由 前 面 的 推导 可 知 , 对 增 广 矩 阵 进行 消 元 变换 的 目的 是 把 一 个 非 基 本 变量 zx 转变 为 基本 
变量 zx,* 即 把 该 非 基 本 变量 的 值 由 零 变 为 正 值 。 由 式 (6-13) 可 以 看 出 ,为 了 使 目标 函数 的 值 
有 所 下 降 ,该 非 基本 变量 zx; 所 对 应 的 系数 必须 小 于 零 。 

若 令 


中 一 避 一 Dicamj (GG=m+i+lm+2,,n) (6-14) 
i=] 


则 应 满足 
o;=0 
其 中 ,oj 为 第 7 列 的 判别 数 。 
因 非 基本 变量 所 对 应 的 系数 就 是 变化 主 元 ,由 上 式 可 知 , 主 元 所 在 列 的 判别 数 应 是 负数 ， 
而 且 负 得 越 多 ,目标 函数 下 降 得 越 多 。 可 见 , 主 元 所 在 列 应 按 式 (6-15) 选 取 
中 一 minfojlo 玫 0 (7 一 加 十 1 ,7 十 2 2) ) (6-15) 
若 取 式 (6-15) 中 的 7 为 某 个 基本 变量 对 应 的 列 数 s 时 ,由 式 (6-14) 有 
@=6—[6 “we ei ce Gri ve CaO 0 1 0 .»% 0 =6—6,=0 
这 表明 ,基本 变量 对 应 的 判别 数 都 等 于 零 。 因 此 , 式 ( 6-15) 可 写 为 
ot=min(o (j=1,2,°»n)} (6-16) 
当 所 有 判别 数 的 值 均 为 非 负 时 ,目标 函数 不 再 有 下 降 的 可 能 ,这 时 的 基本 可 行 解 就 是 所 求 
线性 规划 问题 的 最 优 解 。 由 此 可 知 ,基本 可 行 解 的 最 优 性 条 件 是 
oj 之 0 (j=1,2y°%,n) (6-17) 
综 上 所 述 ,为 了 满足 基本 可 行 解 变换 的 两 个 基本 条 件 ,必须 按 下 式 选 定 变换 主 元 
一 min{(o (j=1,2,.…,n))} 
b 


i a i 
Qk Ci 


例 6-1 求 线性 规划 问题 
min f(X)=zi+ zs 
Ss. t. 5zi 一 4zz 十 13zs 一 274 十 zs; 二 20 
wi 一 ZV 卡 523 一 于 ( 丰 % 三 8 


TI» TX2 TX3 9T4 ss 0 
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解 ” 构 造 增 广 矩阵 
|， 一 天 汉 外 | 
于， 一 
进行 两 次 初等 行 变换 后 得 
|。 Qe ad 
OG 1 = 3 = 一 20 
由 此 得 到 一 个 基本 解 : 
Rr ws 二 [一 2 一 0 0 oF 
因 z= 一 12 和 z 一 一 20 均 小 于 零 , 所 以 此 解 不 是 基本 可 行 解 。 继 续 以 a2.; 二 一 4 为 主 元 
进行 下 一 次 消 元 变换 得 
A = 2 = 0 . 
0 -~—1/4- 8——83/4 {1》 § 
由 此 得 到 另 一 个 基本 解 
X= 0 0 0 dl 
因 zi 三 3,zs 三 5 均 大 于 零 , 所 以 此 解 是 一 个 基本 可 行 解 。 
用 非 基本 变量 表示 基本 变量 时 有 


XI = 2 + 地 十 3 


1 3 
Xs 3rs 十 5 


代入 目标 函数 ,得 
FR )=T x27 + 地 十 3 

由 此 可 知 , 非 基本 变量 的 判别 数 
SY 二 a 
EL 0 一 一 2， oO 


由 于 o;3 达 0, 所 以 XX 不 是 最 优 解 , 故 应 作 下 一 次 变换 。 由 于 
minlo; +03 »04 } 一 (地 ,一 2, 二 = 一 2=a 


min( -las>0 Gi=1,214=3)]=min[ 吝 ' 训 
人 2 3 


因此 下 一 次 变换 得 主 元 应 选 ww,: 王 2 ,变换 后 的 增 广 矩阵 为 
| 一 5 《一 了 8 0 | 
一 3/2 7/8 0 = 1 去 2 
由 此 得 到 另 一 基本 可 行 解 
一 [IO 0 15 0 0.5] 





并 且 有 
1 3 1 3 
Ta3™ 2 谍 1 如 T2 二 Ta 下 六 
7 
2 


代入 目标 函数 有 f(X”) 二 zz 十 x。 
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这 时 ,判别 数 o ==o; ==1,60 = 二 0 都 是 大 于 等 于 零 , 全 为 非 负 , 故 知 X= 二 [0,0]' 和 A(X) 
二 0 就 是 原 线性 规划 问题 的 最 优 解 。 


6.1.4 单纯 形 法 


单纯 形 法 是 基于 前 述 基 本 可 行 解 的 变换 原理 构成 的 一 种 线性 规划 算法 ,一 般 采 用 单纯 形 
表 进 行 变换 , 亦 称 单纯 形 表 法 。 
1. 单纯 形 表 
对 于 式 (6-1) 所 示 的 线性 规划 问题 一 般 形式 ,可 建立 如 表 6-1 所 示 的 单纯 形 表 , 它 是 以 约 
东方 程 的 增 广 和 矩阵 为 中 心 构造 的 一 种 变换 表格 。 表 中 ,zx,(i 一 1,2,…,n) 表 示 非 基本 变量 ,x 
(三 n 十 1 ,nn 十 2,…,n 十 m) 表 示 基 本 变量 。 
表 6-1 单纯 形 表 




















可 以 看 出 ,单纯 形 表 包 含 线性 规划 问题 求解 过 程 中 的 全 部 信息 ,基本 可 行 解 的 产生 和 转换 
都 可 以 归结 为 单纯 形 表 的 变换 。 

单纯 形 表 的 变换 规则 如 下 。 

(1) 一 张 单纯 形 表 对 应 一 个 基本 可 行 解 ,这 个 解 由 m 个 基本 变量 的 非 负 值 和 个 非 基 本 
变量 的 零 值 共同 组 成 。 系 数 矩 阵 中 各 个 基 向 量 列 (一 个 元 素 为 1 ,其 他 元 素 为 0) 所 对 应 的 变量 
为 基本 变量 ,其 中 的 “1” 所 对 应 的 顶端 变量 x; 和 左 端的 基本 变量 z, 应 是 同一 个 变量 ,它们 的 
值 分 别 等 于 同行 右 端的 常数 项 6;。 

(2) 当 单 纯 形 表 中 最 下 一 行 的 判别 数 全 为 非 负 数 时 ,此 单纯 形 表 对 应 的 基本 可 行 解 就 是 
所 求 线性 规划 问题 的 最 优 解 ; 当 这 些 判 别 数 中 有 负数 存在 时 ,还 需 作 下 一 次 的 消 元 变换 。 

(3) 下 一 次 变换 的 主 元 列 就 是 判别 数 的 负 值 最 多 的 一 列 ; 主 元 行 / 则 是 用 主 元 列 中 正 
的 系数 a 去 除 同行 内 的 常数 项 45; 之 商 值 中 最 小 的 那 一 行 。 

(4) 单纯 形 表 中 对 增 广 矩阵 部 分 的 消 元 变换 分 两 步 进行 , 首 先 用 主 元 a 去 除 主 元 行内 的 
各 个 元 素 a ,把 主 元 变 为 “1”; 然 后 作 m 一 1 次 初等 行 变换 ,把 主 元 列 & 中 除 主 元 之 外 的 其 他 元 
素 全 部 变 为 “0”。 

(5) 基本 变量 所 对 应 的 各 列 的 判别 数 始终 等 于 零 ; 非 基本 变量 所 对 应 的 各 列 的 判别 数 ,等 
于 该 列 顶 端的 系数 值 c; 减 去 同 列 中 的 各 个 系数 a5 与 左 侧 系数 c; 乘积 之 和 , 即 m = c 一 


>)carie 右 下 角 的 f(X) 等 于 最 后 一 列 顶端 的 c。 加 上 各 行 的 b; 与 左 端 系数 c; 乘积 之 和 , 即 


i=1 


f(X) = 6+ Dcibi。 
i=1 
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(6) 当 约 束 条 件 中 有 等 式 约 束 存 在 时 ,在 这 些 约束 中 分 别 引 入 人 工 变量 ,并 以 人 工 变量 之 
和 作为 目标 函数 ,构造 辅助 规划 问题 和 相应 的 单纯 形 表 。 对 此 单纯 形 表 进行 变换 , 当 右 下 角 的 
f(X) 等 于 零 时 , 表 中 原 设计 变 量 所 对 应 的 解 就 是 原 线性 规划 问题 的 一 个 初始 基本 可 行 解 。 得 
到 初始 基本 可 行 解 后 ,重新 建立 原 线性 规划 问题 的 单纯 形 表 , 继续 变 换 便 可 得 到 原 问 题 的 最 
优 解 。 

2. 单纯 形 法 的 计算 步骤 

(1) 给 定 一 个 初始 基本 可 行 解 X'” ,并 置 & 一 0。 

(2) 按 下 式 计算 判别 数 。 


0; 三 5 一 Deiai (7 = 1,2,°,n) 
i=1 


”车 之 0 一 1,2,…,) , 则 令 X* 一 X ,7CX ) 一 /CX%), 结 束 计算 ;否则 进行 下 一 步 。 
(3) 按 下 式 选 定 主 元 au 。 
or—=min{o; (j=1,2,",n))} 


b, 
ET 


ts (i=1,2," ,mm) 
Qa,k Ui,k 





(4) 以 aw 为 主 元 按 式 (6-7) 进 行 一 次 消 元 变换 ,得 到 新 的 基本 可 行 解 X**，, 令 二 k 十 1， 
转 到 第 (2) 步 。 
单纯 形 算法 的 程序 框图 如 图 6-1 所 示 。 


求 苹 :如 =min{ 名 lau>a (e120m) 


ik 


以 ax 为 主 元 作 消 元 变换 
by 


ay ay bi y 
an= 一 ,ay=ay-ay—— ;b= bi=ara, 
Dn TE 





(=1,2.°°,m;j=1,2,…°,n) 


得 基本 可 行 解 XC 7 


6-1 单纯 形 法 程序 框图 
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例 6-2 求解 线性 规划 问题 
min 三) 一 一 607 一 1207s? 
s, t, 9z 十 47z<360 
3zi 十 10z 委 300 
4Zzi 十 5zz 和 200 


I ,Xs 宕 0 


解 (1) 引入 松弛 变量 x;、xs 和 zs ,将 问题 变 为 线性 规划 的 一 般 形式 


min f(X)=—60zx1—120zx; 
s. t. 9Xxi 十 4zxs 十 ZX3 二 360 
3ZX1 十 10z; 十 x 二 300 
47zl 十 5zz 十 Zi 一 200 
ZiZ22Z3527520 
(2) 建立 初始 单纯 形 表 ( 见 表 6-2)。 
表 6-2 初始 单纯 形 表 





Tl Xz 3 I: Xs b 
基本 变量 
系数 一 60 一 20 0 0 0 0 
Ty 0 9 4 1 0 0 360 
Ti 0 3 (10) 0 1 0 300 
ZL 0 4 3 0 0 1 200 
0; 一 60 一 120 0 0 0 0 
(3) 得 到 初始 基本 可 行 解 。 
Xe 一 [0 0 360 300 200]', f(X'™”)=0 
由 于 判别 数 mr 和 o 均 小 于 零 , 故 XX" 不 是 最 优 解 ,又 因 
min{g1 soz yos yot yoi} 一 az 一 一 120 
min laa>0 (一 1,2,3) = 主 = 罗 
k=2,1=2 
所 以 , 选 az.; 二 10 作为 下 一 次 变换 的 主 元 。 
(4) 以 az,z 一 10 作 主 元 进行 消 元 变换 得 新 的 单纯 形 表 ( 见 表 6-3) 。 
表 6-3 消 元 后 的 单纯 形 表 
Zl 工 2 Xa by Ls b 
基本 变量 
系数 一 60 一 120 0 0 0 0 
Xa 0 7.8 0 1 一 0.4 0 240 
Tr 一 人 20 0. 3 1 0 0.1 0 30 
Zz 0 (2 5) 0 0 TQ.5 1 50 
oj 一 24 0 0 12 0 一 3600 
对 应 的 解 是 


X=[0 30 240 0 50]', f/f(X'”)=—3600 


第 6 章 优化 设计 中 一 些 特殊 问题 。107 。 


由 于 mi 二 一 24 一 0, 此 解 不 是 最 优 解 ,还 需要 继续 变换 。 又 因 
b _ 50 


min lan>0 (i=1,2,3) 一 站 一 到 
故 下 一 次 变换 的 主 元 应 选 'w,s 一 2.5。 
(5) 以 a1.s 二 2.5 作为 主 元 进行 消 元 变换 得 到 新 的 单纯 形 表 ( 见 表 6-4) 。 
表 6-4 再 次 消 元 后 的 单纯 形 表 


ol 








Xl Xz Wa Xs Xs b 
基本 变量 
系数 一 NGC = 20 0 0 0 0 
Ts 0 0 0 (1) 1.16 Rl 84 
T ==120 0 Y 0 0.16 一 0,]2 24 
Xl 一 60 1 0 0 一 052 0.4 20 
Oj 0 0 0 Te 9.6 一 4080 
对 应 的 解 为 


Xe 一 [20 24 84 0 0]', f(X®?)=—4080 
由 于 此 解 对 应 的 判别 数 oj 均 为 非 负 数 , 故 此 解 是 引入 松弛 变量 后 所 求 问 题 的 最 优 解 。 去 
除 松弛 变量 可 知 , 原 线性 规划 问题 的 最 优 解 为 


XX" = El f(X'* )=—4080 
6.2 离散 变量 优化 


6.2.1 离散 变量 优化 问题 


在 实际 机 械 工程 设计 中 经 常会 遇 到 混合 设计 变量 的 问题 , 即 在 数学 模型 中 同时 存在 连续 
设计 变量 . 整 型 设计 变量 和 离散 设计 变量 。 例 如 :齿轮 的 齿 数 、 传 动 带 的 根 数 、 链 轮 的 齿 数 和 行 
星 轮 的 个 数 等 为 整数 变量 ,齿轮 模 数 、 螺 栓 的 公称 直径 、 钢 板 的 厚度 和 弹簧 的 材料 直径 等 为 离 
散 变量 。 因 此 ,离散 变量 是 指 那些 在 规定 的 变量 界限 内 ,只 能 从 有 限 个 离散 数 中 取 值 的 变量 。 
整数 变量 其 实 就 是 离散 变量 的 一 种 特殊 形式 。 

在 机 械 优化 设计 中 ,常见 的 约束 非 线性 混合 变量 优化 设计 问题 的 数学 模型 表达 式 为 


min f(X) 
(6-18) 
9., gi(X)<O (j=1,2,°",m) 
X=[xa 元 B= XJER 
X=[z: zx * zeER? 
式 中 : i 
于 < 一 [zol Tpt2 “ 起 ER 
R"=R?UR° 


其 中 ,n 为 设计 变量 的 维 数 ,m 为 不 等 式 约束 的 个 数 ,p 为 离散 变量 的 个 数 ,X” 为 离散 变量 的 
子 集合 ,R?” 为 离散 变量 构成 的 子 空间 ,X° 为 连续 变量 的 子 集合 ,R” 为 连续 变量 构成 的 子 空 
间 。 当 R? 为 空 集 时 ,为 全 连续 变量 优化 问题 , 即 常规 的 优化 问题 ; 当 了 R 为 空 集 时 ,为 全 离散 
变量 优化 问题 ; 当 R” 和 R- 均 为 非 空 集 时 ,为 混合 离散 变量 优化 问题 。 
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6.2.2 离散 变量 优化 方法 


约束 非 线 性 离散 变量 的 优化 方法 有 : 

(1) 以 连续 变量 优化 方法 为 基础 的 方法 ,如 圆 整 法 , 拟 离散 法 、 离 散 惩罚 函数 法 ; 

(2) 离散 变量 的 随机 型 优化 方法 ,如 离散 变量 随机 试验 法 、 随 机 离散 搜索 法 ; 

(3) 离散 变量 搜索 优化 方法 ,如 启发 式 组 合 优化 方法 .整数 梯度 法 .离散 变量 复合 形 法 ; 

(4) 其 他 离散 变量 优化 方法 ,如 非 线性 隐 枚 举 法 、 分 支 定 界 法 .离散 型 网 格 与 离散 型 正 交 
网 格 法 离散 变量 的 组 合 型 法 。 

上 述 这 些 方法 的 解 题 能 力 与 数学 模型 的 函数 性 态 和 变量 的 数目 有 很 大 关系 。 下 面 简要 介 
绍 其 中 几 种 重要 方法 。 

1， 圆 整 法 

圆 整 法 是 解决 离散 变量 优化 问题 最 常用 的 方法 。 该 方法 先 把 所 有 变量 视 为 连续 变量 ,在 
求 得 连续 变量 最 优点 后 ,再 把 其 调整 为 与 相应 的 设计 规范 和 标准 最 接近 的 离散 点 , 即 所 谓 的 圆 
整 解法 。 图 6-2(a) 中 A 和 B 两 点 分 别 表示 二 维 离散 变量 优化 问题 圆 整 法 中 的 连续 最 优点 和 
离散 最 优点 。 这 种 方法 比较 简单 ,但 可 能 出 现下 列 两 种 问题 : 

(1) 与 连续 最 优点 A 最 接近 的 离散 点 B 落 在 可 行 域外 ,如 图 6-2(b) 所 示 。 一 般 来 说 ,这 
是 工程 实际 所 不 能 接受 的 。 

(2) 与 连续 最 优点 A 最 接近 的 离散 点 B 虽 在 可 行 域内 ,但 并 非 离 散 最 优点 , 仅 是 一 个 工 
程 实际 可 能 接受 的 较 好 的 设计 方案 ,如 图 6-2(c) 所 示 , 点 C 是 比 点 B 更 优 的 离散 点 。 





6-2 离散 变量 优化 问题 的 最 优 解 


可 以 对 圆 整 法 存在 的 问题 进行 改进 , 即 在 求 得 连续 最 优点 A 并 调整 到 最 接近 的 离散 点 B 以 
后 , 找 出 点 B 单 位 邻 域内 所 有 的 离散 点 ,逐个 判断 其 可 行 性 并 比较 其 函数 值 的 大 小 ,从 中 找 出 离 
散 局 部 最 优点 。 值 得 注意 的 是 , 圆 整 法 的 解 一 般 都 是 基于 离散 最 优点 在 连续 最 优点 的 附近 ,但 由 
于 实际 工程 问题 的 复杂 性 ,不 能 排除 在 离 连续 最 优点 较 远 的 离散 点 恰恰 是 真正 最 优点 的 可 能 性 。 

2. 拟 离散 法 

拟 离散 法 是 在 求 得 连续 变量 优化 解 X* 后 ,不 是 用 简单 的 圆 整 方法 来 寻 优 ,而 是 在 点 XX* 
附近 按 一 定 方法 进行 搜索 来 求 得 优化 离散 解 。 该 法 虽 比 前 述 圆 整 法 前 进 了 一 步 ,但 因 仍 是 在 
连续 变量 优化 解 附近 邻 域 进行 搜索 ,往往 也 不 可 能 取得 正确 的 离散 优化 解 。 

1) 变 替 查 点 法 (Luns 法 ) 

该 法 适用 于 全 整数 变量 优化 问题 ,其 离散 解 的 搜索 方法 如 下 。 

(1) 先 按 连续 变量 求 得 优化 解 X 7” ,并 将 它 圆 整 到 满足 约束 条 件 的 整数 解 上 ; 

(2) 依次 将 每 个 圆 整 后 的 优化 分 量 [xi ](i 王 1,2,…,n) 加 1; 检 查 该 点 是 否 为 可 行 点 , 然 
后 仅 保 留 目 标 函 数值 为 最 小 的 zx; 点 ;重复 此 过 程 ,直到 可 靠 的 zx; 不 再 增 大 为 止 ; 
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(3) 将 一 个 分 量 加 1, 其 余 n 一 1 个 分 量 依次 减 1, 如 将 zi 增加 到 zi 十 1, 再 将 xz; 减 小 至 
Zs 一 1, 但 暂 不 作 代 换 , 继 续 此 循环 ,将 zs 减 到 zx; 一 1, 也 暂 不 作 代 换 ,直到 继续 循环 到 zx, 为 
止 ;最 后 选择 目标 函数 值 为 最 小 的 点 去 替换 旧 点 。 再 依次 增 大 zz ,xs，… ,Xx, ,重复 上 述 循 环 。 
最 终 比 较 目 标 函 数值 的 大 小 ,找到 优化 解 , 即 认 为 是 该 问题 的 整数 优化 解 。 

2) 离散 分 量 取 整 ,连续 分 量 优化 法 

(1) 该 法 是 针对 混合 离散 变量 问题 ( 即 变量 中 既 含 有 离散 分 量 ,也 含有 连续 分 量 ) 提 出 来 
的 。 该 方法 的 步骤 为 : 

中 先 将 连续 变量 优化 解 X" 圆 整 到 最 近 的 一 个 离散 LX* ] 上 ; 

@ 将 [X" ] 的 离散 分 量 固 定 , 对 其 余 的 连续 分 量 进行 优化 ; 

@ 车 得 到 的 新 优化 点 可 行 , 且 满 足 收敛 准则 , 则 输出 优化 结果 ,结束 ; 

@ 否则 ,把 离散 分 量 移 到 X" 邻近 的 其 他 离散 点 上 ,再 对 连续 分 量 优 化 , 即 转 到 第 (2) 步 。 
如 此 重复 ,直到 XX" 附近 离散 点 全 部 轮换 到 为 止 。 

该 法 实际 上 只 能 从 上 述 几 个 方案 中 选 出 一 较 好 的 可 行 解 作为 近似 优化 解 。 由 于 离散 变量 
移动 后 得 到 的 离散 点 可 能 已 在 可 行 域 之 外 , 故 要 求 连续 变量 所 用 优化 程序 应 选择 初始 点 可 以 
是 外 点 的 一 种 算法 。 上 述 算法 可 适用 于 设计 变量 较 多 但 连续 变量 显著 多 于 离散 变量 的 情形 ， 
且 其 计算 工作 量 增加 不 大 。 

(2) 对 离散 变量 较 多 ,而 变量 维 数 又 较 低 ( 小 于 6) 时 的 混合 离散 变量 问题 ,其 算法 步骤 如 下 。 

@ 求 出 连续 变量 优化 解 X* , 取 整 到 最 靠近 X* 的 离散 值 上 。 

@ 令 变 量 的 灵敏 度 为 g;, 它 是 目标 函数 的 增 量 与 自 变量 的 比值 。 即 

g;=|[f(X)—f(K+AX)/AX | 
它 反 映 了 变量 对 目标 函数 的 影响 程度 。 计 算 各 离散 变量 的 灵敏 度 q,, 并 将 离散 变量 按 灵 敏 度 
从 大 到 小 的 顺序 排队 :zi ,zs，*… ,zi,1 寺 kn。 

@ 先 对 灵敏 度 最 小 的 离散 变量 zx 作 离 散 一 维 搜索 ,并 使 其 他 的 离散 变量 zl ,zz ，… ,zt-1 
固定 不 变 。 每 当 搜 索 到 一 个 较 好 的 离散 点 时 , 便 需 要 对 所 有 连续 变量 优化 一 次 。 然 后 ,再 对 
zx-1 作 一 维 离散 搜索 ;此 时 将 其 余 的 离散 变量 T19T2 9 9 Th—2 保持 不 变 ,但 对 分 量 zt 还 要 再 作 
一 次 搜索 。 找 到 好 的 离散 点 后 仍 需 对 所 有 连续 变量 再 次 优化 。 如 此 重复 ,直到 zi 为 止 。 

@ 由 上 述 第 (3) 步 所 得 终点 ,重新 计算 灵敏 度 并 进行 排队 。 若 与 第 (2) 步 结果 相近 , 则 停 
止 计 算 ,其 终点 即 为 优化 解 。 若 两 者 相差 较 大 , 则 转 到 第 (3) 步 继续 搜索 。 

拟 离散 法 是 目前 求解 离散 变量 优化 的 一 种 常用 方法 ,但 这 类 算法 都 是 基于 离散 优化 解 一 
定 在 连续 优化 解 附 近 的 这 样 一 种 观点 的 基础 之 上 。 而 实际 情况 又 往往 不 一 定 是 这 样 的 ,而 且 
这 类 算法 的 工作 量 较 大 ;因此 具有 一 定 的 局 限 性 。 

3， 离散 复合 形 法 

该 方法 是 在 离散 空间 直接 搜索 ,使 能 搜索 到 真正 离散 优化 解 的 可 能 性 增加 ,而 且 由 于 搜索 
范围 只 限于 离散 点 ,缩小 了 搜索 范围 ,加 快 了 求解 速度 。 由 于 离散 复合 形 法 产生 初始 顶点 及 新 
点 方法 不 同 , 可 以 有 多 种 不 同 的 离散 复合 形 法 。 但 其 共同 点 是 必须 把 复合 形 顶 点 移 到 离散 点 
上 , 且 对 原 连 续 变量 寻 优 的 复合 形 法 中 寻 优 规则 和 收敛 终止 准则 作 了 改进 。 如 每 次 得 到 的 复 
合 形 顶 点 都 是 离散 点 , 则 此 法 要 比 前 述 圆 整 法 更 容易 找到 离散 优化 解 ,是 一 种 较 好 的 方法 。 其 
具体 算法 如 下 。 

(1) 在 nn 维 空间 中 产生 由 2z 十 1 个 初始 顶点 Xa 组 成 的 复合 形 ,并 将 每 个 顶点 均 移 到 附近 
的 可 行 离散 点 上 。 
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(2) 将 上 述 已 产生 的 顶点 Xs , 按 目 标 函 数值 由 大 到 小 排列 ; 即 
2n 二 1) 
记 最 坏 点 X% 为 An。 

(3) 求 出 点 An 外 所 有 项 点。 的 点 集中 心 (又 称 几 何 中 心 ) , 即 2n 个 顶点 的 算术 平均 值 ， 
连接 A# 与 点 集中 心 ,并 以 点 集中 心 为 核心 , 找 出 Ar 的 反射 点 Ap 作为 新 点 ,并 将 Ap 也 移 到 
附近 离散 点 上 。 

(4) 检查 点 Ap 是 否 可 行 , 比 较 Ap 与 所 有 顶点 的 目标 函数 值 。 

(5) 若 An 是 可 行 点 又 比 An 点 的 目标 函数 值 好 , 则 表示 Ar 是 可 接受 的 点 ,用 Ar 代替 
An 点 , 转 到 步骤 (2); 和 否则, 沿 反射 的 反方 向 搜索 ,并 确定 新 点 。 

(6) 车 用 上 述 方法 仍 得 不 到 可 接受 的 好 点 , 则 可 令 An 一 2 (或 An 一 时 全 ，XWD ，…， 
Xw ) , 转 到 步 又 (3)。 

(7) 当 An 二 Xa(k) 点 后 , 仍 找 不 到 好 点 ,或 当 复合 形 退 化 到 只 是 一 个 点 一 条 线 或 一 个 平 
面 时 ,表示 算法 收敛 ,可 取 此 时 复合 形 项 点 中 最 好 的 顶点 作为 离散 优化 解 。 

用 上 述 的 离散 复合 形 法 已 成 功 地 解决 了 一 些 设计 问题 。 但 此 法 一 般 不 适用 于 变量 较 多 的 
高 维 问题 ,建议 在 10 维 以 下 使 用 ,但 也 有 用 到 20 维 的 。 有 时 为 了 提高 算法 解 题 的 可 靠 性 , 程 
序 中 又 加 入 了 加 速 策略 、 分 解 策略 和 网 格 搜索 等 多 种 辅助 功能 ,这 样 一 来 使 程序 比较 复杂 , 且 
各 种 策略 的 选用 要 依赖 于 设计 者 的 经 验 及 对 算法 的 熟悉 程度 ,因而 对 使 用 者 要 求 较 高 。 

4. 网 格 法 

网 格 法 是 求解 离散 变量 优化 问题 的 一 种 最 原始 的 遍 数 法 , 亦 称 枚 举 法 。 它 是 在 离散 变量 
的 值 域内 ,以 各 变量 的 可 取 离 散 值 为 间隔 ,把 设计 空间 划分 为 若干 个 网 格 ,再 计算 域内 的 每 个 
网 格 节点 上 的 目标 函数 值 ,比较 其 大 小 ,并 以 目标 函数 值 最 小 的 网 格 点 为 中 心 ,在 其 附近 空间 
划分 更 小 的 网 格 ,再 计算 在 域内 各 节点 上 的 目标 函数 值 。 这 样 重复 进行 下 去 ,直到 网 格 小 到 满 
足 精 度 要 求 为 止 ,这 时 即 可 搜索 到 离散 最 优化 点 。 

这 种 方法 原理 简单 ,易于 编制 算法 框图 和 计算 机 程序 ， 
特别 在 设计 变量 较 少 ,离散 变量 可 选择 的 值 也 较 少 时 比较 实 
用 。 如 图 6-3 所 示 的 二 维 离散 变量 问题 。 但 是 , 当 设计 变量 
维 数 以 及 每 个 变量 离散 值 数目 很 多 时 ,要 计算 的 网 格 节点 数 
目 成 指数 每 增 加 ,其 计算 量 就 会 很 大 , 故 很 少 用 它 。 为 了 提 
高 网 格 搜索 效率 ,通常 可 先 把 设计 空间 划分 为 较 稀 朴 的 网 
人 格 ,如 先 按 50 个 离散 增 量 划分 网 格 ,找到 最 好 点 后 再 在 该 点 
0 附近 空间 以 10 个 离散 增 量 为 间隔 划分 网 格 ,并 在 这 个 范围 

图 6-3 二 维 离散 变量 网 格 图 缩小 、 密 度 增 大 的 网 格 空间 中 进一步 搜索 最 好 的 节点 。 如 此 
重复 ,直至 网 格 节点 的 密度 与 离散 点 的 密度 相等 , 即 按 一 
离散 增 量 划分 网 格 节点 为 止 ,这 时 将 搜索 到 的 最 好 点 作为 离散 优化 点 。 










6.3 多 目标 优化 


6.3.1 多 目标 优化 问题 
在 日 常生 活 和 工程 实际 中 ,对 于 一 个 方案 经 常 要 求 不 止 一 项 指标 达到 最 优 , 而 是 要 求 多 项 
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指标 (如 经 济 性 ,使 用 性 能 \ 技 术 等 指标 ) 都 同时 达到 最 优 , 即 希 望 使 多 个 目标 在 给 定 区 域内 都 
尽 可 能 好 。 例 如 ,人 们 在 购物 时 要 求 “ 物 美 价 廉 ”, 其 中 “物美 "和 “ 价 廉 " 就 是 两 个 指标 。 如 对 于 
一 个 生产 过 程 ,总 是 期 望 高 产 出 ,同时 还 要 求 少 用 料 .省 工时 等 。 再 如 在 设计 一 台 齿 轮 变 速 箱 
时 ,常常 希望 它 的 质量 轻 、 制 造成 本 低 .寿命 长 .运转 噪声 小 .传动 效率 高 等 。 这 种 使 多 个 设计 
指标 都 达到 最 佳 的 最 优化 问题 ,就 称 为 多 目标 优化 设计 问题 。 多 目标 优化 设计 问题 的 数学 模 
型 一 般 可 以 表达 为 

VY 一 minF (X)=min[Lfi(X) fo(X) 1 f, CX)]' 


XER" 
s.t, gi(X)EZO (=1,2,%,m) (6-19) 
hiCX}=0 (k=1123% Ln) 
式 中 :F(CX) 王 minL 户 (X) fi(X) … f/f,(X)]' 为 向 量 目标 函数 ;V 一 minF (XX) 表 示 多 目标 
XER” 


极 小 化 数学 模型 用 向 量 形式 简写 ;V 一 min 表示 向 量 极 小 化 , 即 向 量 目标 函数 中 的 各 个 分 目标 
函数 都 尽 可 能 极 小 化 ;g,(X) 三 0 和 心 (X) 王 0 为 设计 变量 X 应 满足 的 所 有 约束 条 件 。 

一 般 情况 下 ,评价 系统 的 各 种 目标 都 是 从 不 同 侧面 反映 系统 的 ,很 难 用 其 中 一 个 指标 来 代 
替 其 他 指标 ,因此 ,这 类 问题 一 般 无 最 优 解 可 取 。 故 在 多 目标 优化 问题 中 得 到 的 只 是 非 劣 解 。 
能 使 一 些 目标 达到 极 小 值 ,而 对 另 一 些 目标 则 不 一 定 能 达到 极 小 值 的 解 为 非 劣 解 (或 有 效 解 ) 。 
而 非 劣 解 往往 不 止 一 个 , 故 需 要 从 多 个 非 劣 解 中 找 出 一 个 最 优 解 。 显 然 ,多 目标 优化 问题 只 有 
当 求 得 的 解 是 非 劣 解 时 才 有 意义 ,而 绝对 最 优 解 存在 的 可 能 性 很 小 。 


6.3.2 多 目标 优化 方法 


多 目标 优化 问题 的 求解 方法 很 多 ,其 中 主要 有 两 大 类 :一 类 是 直接 求 出 非 劣 解 ,然后 再 从 
中 选择 较 好 的 解 ; 另 一 类 是 将 多 目标 优化 问题 在 求解 时 作 适 当 的 处 理 。 处 理 的 方法 可 分 为 两 
种 :一 种 是 将 多 目标 优化 问题 构造 成 一 个 新 的 函数 , 即 评价 函数 ,从 而 将 多 目标 优化 问题 转化 
为 单 目 标 优化 问题 进行 求解 ; 另 一 种 是 将 多 目标 优化 问题 转化 为 一 系列 单 目标 优化 问题 来 求 
解 。 下 面 介绍 几 种 常用 的 多 目标 优化 方法 。 

1. 主要 目标 法 

由 于 在 多 目标 优化 问题 中 各 个 目标 的 重要 程度 不 一 样 ,在 优化 设计 中 要 抓 住 主要 目标 , 同 
时 兼顾 其 他 次 要 目标 。 主 要 目标 法 的 思想 是 从 所 有 p 个 分 目标 函数 1 (X),f:(X),…,f,(X) 
中 ,根据 设计 者 的 需求 将 其 中 一 个 认为 最 重要 的 分 目标 作为 主要 目标 ,只 对 其 进行 优化 ,而 将 
其 余 p 一 1 个 分 目标 函数 限制 在 一 定 的 范围 内 ,使 其 转化 为 新 的 约束 条 件 。 也 就 是 用 约束 条 
件 的 形式 来 保证 其 余 分 目标 函数 不 致 太 差 。 这 样 处 理 后 , 原 多 目标 优化 问题 就 转化 为 单 目标 
优化 问题 。 

设 有 户 个 分 目标 函数 广 (XX),f;(XX),…,f,( 六 ) ,求解 时 可 从 p 个 多 目标 函数 中 选择 一 个 
分 目标 函数 f,(X) 作 为 主要 目标 , 则 问题 变 为 

minf,(X) (l<s<p) 


XER” 

s.t. g/ (XO (=1,23° ,im) 

hiCX)=0 (0 一:2 Ln) 

gnii(X)=f(X)— SO (i=1,2, ,5 一 1,5 十 1，…， 力 ) 
式 中 :及 (i 二 1,2,…,s 一 1,s 十 1,…,p) 为 原 目标 优化 问题 的 第 i 个 分 目标 函数 的 上 限 值 。 如 果 


(6-20) 
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其 中 有 分 目标 是 求 极 大 值 的 , 则 对 应 的 及 为 下 限 , 同 时 不 等 式 需 改写 。 

2. 线性 加 权 法 ' 

线性 加 权 法 又 称 线性 加 权 组 合法 或 加 权 因 子 法 ,其 基本 思想 是 :根据 各 个 分 目标 函数 依 其 
在 整体 设计 中 的 相对 重要 程度 及 在 量 级 和 量 纲 上 的 差异 ,分别 赋予 它们 一 个 权 系数 , 然 后 把 这 
些 权 系数 与 对 应 目标 函数 相 乘 后 求 和 构成 一 个 新 的 统一 目标 函数 ,其 最 优 解 即 作 为 原 多 目标 
极 小 化 问题 的 解 ,从 而 实现 多 目标 向 单 目标 优化 问题 的 转化 。 分 目标 对 应 的 系数 越 大 ,该 目标 
“的 重要 程度 和 优先 级 别 就 越 高 。 
根据 多 目标 问题 中 各 分 目标 函数 户 (X) , 户 (X) ,万 (X) 的 重要 程度 ,对 应 地 确定 一 组 


p 
权 系 数 WI1 » CU2 ,ob 并 有 Du -> ls 且 ww 二 0 (i 二 1,2,"… sp) ,用 fi(X) 与 wi 的 线性 组 合 构 
成 一 个 评价 函数 如 下 
p 
F(X) = Dwfi(X) — min (6-21) 
i=1 


由 于 在 实际 设计 中 各 目标 函数 的 量 纲 不 一 定 相 同 ,其 数量 级 也 可 能 相差 甚 殊 。 因 此 ,在 选 
择 加 权 因 子 时 应 兼顾 几 方面 。 首 先 应 对 各 目标 函数 进行 量 纲 统一 处 理 , 使 其 变 为 规格 形式 , 然 
后 再 考虑 各 分 目标 的 重要 程度 和 数量 级 的 差异 ,选择 合适 的 权 系数 wi。 

线性 加 权 法 的 关键 是 如 何 选取 合适 的 权 系数 , 权 系数 的 确定 是 否 合 理 直 接 关系 到 优化 结 
果 的 好 坏 。 设 计 者 可 以 根据 经 验 , 试 算 或 估算 来 确定 合适 的 权 系 数 。 下 面 简单 介绍 几 种 权 系 
数 的 确定 方法 。 

(1) 在 原 优化 问题 的 约束 条 件 下 ,分别 对 各 分 目标 函数 求 最 优 值 f;(X" ) ,以 各 分 目标 函 
数 最 优 值 f;:(X" ) 的 倒数 作为 权 系数 , 即 

F(X) = Sf.CX) 

1 , = 
eb 0622 
fi(X*) = min f,(X) 

上 式 反 映 了 各 分 目标 函数 值 偏 离 其 最 优 值 的 程度 ,这 种 方法 适用 于 各 分 目标 具有 相同 重 
要 性 的 情况 。 计算 时 只 需要 事先 计算 出 各 单 目标 函数 的 最 优 值 , 即 可 确定 权 数 。 

(2) 根据 目标 函数 值 的 容 限 确定 权 数 。 

如 果 已 知 各 目标 函数 值 的 变化 范围 为 af;(X) 志 BGi==1,2,…,p), 则 称 Af;(X)== (8 一 
Qi)/2 (i 二 1,2,… ,Pp) 为 各 目标 的 容 限 ,各 权 系 数 为 

wi=1/[Af :OF (=1;2,.",p) (6-23) 

式 (6-23) 表 明 当 某 个 目标 函数 值 变化 越 大 时 ,其 相应 的 容 限 就 越 大 , 权 系 数 就 越 小; 否 
则 , 权 系 数 就 越 大 。 这 样 选取 权 系 数 将 起 到 平衡 各 目标 函数 量 级 的 作用 。 . 

(3) 双 权 数 。 

每 个 分 目标 的 权 数 均 由 两 个 权 数 的 乘积 组 成 , 即 

Wi= (wr) (一 2) 力 ) (6-24) 
其 中 ,wi; 是 针对 各 分 目标 的 重要 程度 而 确定 的 权 数 , 称 为 本 征 权 ;w; 是 调整 各 分 目标 函数 值 在 
数量 级 上 的 差别 影响 ,并 在 优化 设计 过 程 中 逐步 加 以 校正 的 权 数 , 称 为 校正 权 , 一 般 可 根据 
分 目标 函数 的 梯度 来 建立 , 即 
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Nt == wo. 二 
(U2; | V(X) | 2 (i 1523 + 力 ) (6 25,) 


这 样 确定 的 权 数 可 起 到 调节 各 分 目标 函数 变化 快慢 的 作用 。 变 化 快 的 目标 函数 ,其 梯度 
大 , 权 数 则 小 ,反之 亦 然 。 

例 6-3 某 带 式 输 送 机 传动 系统 中 ,第 一 级 用 普通 V 带 传动 。 已 知 电动 机 的 额定 功率 为 
4 kW, 转 速 n 二 1440 r/min, 传 动 比 i 二 3, 用 A 型 线 强 带 ,每 天 运转 时 间 不 超过 10 h。 用 优化 
方法 设计 该 带 传动 ,要 求 V 带 根 数 尽量 少 , 带 轮 直径 尽量 小 ,结构 尽量 紧凑 。 

解 (1) 带 传动 多 目标 优化 数学 模型 的 建立 。 

J 选择 设计 变量 

选择 小 带 轮 的 直径 D 和 带 的 基准 长 度 工 为 设计 变量 , 即 


D Xl 
xz=| = 人 | 
@ 建立 目标 函数 
设计 要 求 V 带 根 数 尽 量 少 , 带 轮 直径 尽量 小 ,结构 尽量 紧凑 ,也 就 是 要 求 V 带 根 数 Z 和 


带 轮 中 心 距 a 以 及 带 轮 直径 D, 尽量 小 。 因 此 可 建立 三 个 目标 函数 : 


PRRLTAP) ™™ 
L—x(D L202) 一 (= ' 
2 2 


i 


fs(X)=a= ( 





) =min 
fi(X)= Dmin 

式 中 :Ps 二 KsP ,Ps。、Ka、\P 分 别 表 示 计 算 功率 、 工 作 状 况 系数 和 额定 功率 ;P。 表示 特定 长 度 
且 工 作 平稳 的 情况 下 , 单 根 普通 V 带 的 许 用 功率 ;k, 为 包 角 系数 ;ki 为 长 度 系 数 ;AP。 为 考虑 
传动 比 影响 的 功率 增 量 ;D, 为 大 带 轮 的 直径 。 

@ 确定 约束 条 件 

a. 小 带 轮 直径 限制 。 

由 于 直径 大 ,传动 的 功率 也 大 ,因此 在 条 件 允 许 时 ,应 选取 较 大 的 带 轮 直 轻 ,以 减少 弯曲 应 
力 ,提高 带 的 寿命 ; 需 保证 小 带 轮 直 径 大 于 等 于 最 小 直径 Di, ,此 约束 条 件 为 

gi1(X)=D,,— D0 

b. 带 的 线 速 度 限制 。 

在 最 佳 带 速 以 下 , 带 传递 功率 的 能 力 与 带 速成 正比 ;但 超过 最 佳 带 速 , 带 传递 功率 的 能 力 
与 带 速成 反比 ;到 达 极 限 带 速 时 带 会 出 现 打滑 。 因 此 ,设计 时 带 速 应 满足 wwn 委 v 委 wx 通常 


_ Dinm 


取 vnin 二 5 m/ssvmax 二 25 m/s。 由 于 v 一 60000 所 以 约束 条 件 为 





Di nn 
60000 
Di ni 
60000 


8z (天 ) 一 5 一 





和 0 





S3 (有 ) 一 一 25 委 0 


c. 小 带 轮 包 角 限 制 。 
带 传动 的 有 效 圆 周 力 随 包 角 的 增 大 而 增 大 ,为 避免 降低 传动 效率 ,小 带 轮 包 角 不 可 过 小 ， 
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需 保 证 小 带 轮 包 角 不 小 于 120 ,所 以 约束 条 件 为 
g1(%)—120°—[180"— < |<o 
d. 中 心 距 限制 。 
增 大 中 心 距 ,可 增 大 带 轮 包 角 ,有 利于 提高 传动 效率 ,对 减缓 带 的 疲劳 损耗 也 有 益 。 但 太 
大 的 中 心 距 会 增加 传动 尺寸 ,要 求 中 心 距 满 足 0.7(Di 十 D,) 志 a 志 2(Di 十 D;), 所 以 约束 条 
件 为 
gs(X)=0.7(Di 二 +D;)—a<0 
gs (X)=a—2(D 二 +D;,)<0 
综 上 所 述 , 带 传动 多 目标 优化 设计 的 数学 模型 为 
LD: 三 ] 三 [z， wj? 
V—minF(X)=minLf1(X) RY ft 


XER’ 
s.t. g(X)<O (j=1,2,.…,6) 

(2) 优化 模型 的 求解 。 

对 于 以 上 所 建立 的 带 传 动 多 目标 优化 数学 模型 ,采用 线性 加 权 的 方法 来 解决 该 问题 。 

@ 评价 函数 的 建立 

由 于 目标 函数 户 (X) 的 量 纲 为 1, 而 且 目 标 函 数 f;(X) 和 f;(X) 的 单位 都 是 mm, 先 对 
万 (CX) 、 户 (CX) 和 户 (X) 作 统一 量 纲 的 处 理 。 根 据 带 传 动 知识 , f;(X) 的 最 小 值 为 0. 5(Di 十 
D;),f(XX) 的 最 小 值 De 可 由 手册 查 出 , 故 经 过 统一 量 纲 处 理 后 ,目标 函数 户 (CX) 和 户 (X) 可 
分 别 用 以 下 两 式 代替 





i + 
jaaX) Dy DD 
六 CD= 蕊 二 


考虑 三 个 目标 函数 的 重要 程度 不 同 , 取 权 数 为 W=[w o wi]'=[0.3 0.4 0.3]" 
于 是 ,建立 评价 函数 如 下 
F(X)=6w) 万 (XK) 二 ow 六 (KX)+ws fs (X) 


2f:(X) 


=0.3Xf1(W)+0.4XBD4D 





0, 3x 蕊 守 EE 


@ 数学 模型 的 求解 

采用 复合 形 法 对 以 上 数学 模型 进行 求解 。 带 的 根 数 、 带 轮 直 径 以 及 带 的 长 度 等 计算 时 均 
按 连 续 变量 处 理 , 有 关 的 离散 表格 数据 需 事先 转换 成 函数 形式 , 求 出 优化 结果 后 再 圆 整 ( 带 的 
根 数 取 整 、. 带 轮 直 径 和 带 的 基准 长 度 符合 标准 )。 该 多 目标 问题 的 最 优 解 为 

-| fi(X")=1.67, fi CX*)=375.83, fs(X")=133 
经 圆 整 得 
Z=2, Di=132 mm, L=1633 mm， 4 一 379. 51 mm 

(3) 功效 系数 法 。 

如 果 每 个 分 目标 函数 f;(X) G 王 1,2,…，,9) 都 用 一 个 称 为 功效 系数 方 (三 12,，……9q) 并 定 
义 于 0 委 访 委 1 的 函数 来 表示 该 项 设计 指标 的 好 坏 (7w 二 1 时 表示 最 好 ,二 0 时 表示 最 坏 ), 那 
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么 被 称 为 总 功效 系数 了 的 这 些 系数 (六 ,六 ,……, 思 ) 的 几何 平均 值 


7 VN (6-26) 
即 表 示 设 计 方 案 的 好 坏 。 因 此 最 优 设计 方案 应 是 
二 /Nm mh max (6-27) 


这 样 , 当 7 一 1 时 ,表示 取得 最 理想 的 设计 方案 ;反之 , 当 7 一 0 时 则 表明 这 种 设计 方案 不 能 
接受 ,这 时 必 有 某 项 分 目标 函数 的 功效 系数 三 0。 

6-4 给 出 了 几 种 功效 系数 的 函数 曲线 ,其 中 :图 6-4(a) 表 示 与 /;(X) 值 成 正比 的 功效 系 
数 % 的 函数 ;图 6-4(b) 表 示 与 f;(X) 值 成 反比 的 功效 系数 % 的 函数 ;图 6-4(c) 表 示 f;(X) 值 
过 大 和 过 小 都 不 行 的 功效 系数 b 的 函数 。 在 使 用 这 些 函 数 时 ,还 应 作出 相应 的 规定 。 例 如 ， 
规定 三 0.3 为 可 接受 方案 的 功效 系数 下 限 ;0. 3 一 妨 二 0. 4 为 边缘 状况 ;0. 4 一 态 一 0 7 为 效果 
“ 稍 差 但 可 接受 的 情况 ;0. 7 三 六 =1 为 效果 较 好 的 情况 。 


1X) 





(b) 
图 6-4 功效 系数 的 函数 曲线 


用 总 功效 系数 了 作为 统一 目标 函数 "F(X), 即 
F(X) 一 7 一 Vi 因 …… 力 一 max (6-28) 
这 样 虽然 计算 稍 繁 ,但 方法 较为 有 效 。 因 为 它 比 较 直 观 且 容易 调整 ,而 且 无 论 各 个 分 目标 
的 量 级 及 量 纲 如 何 , 最 终 都 转化 为 0 一 1 的 数值 ,一 旦 有 一 项 分 目标 函数 值 不 理想 (二 0) ,其 
总 功效 系数 ] 必 为 零 ,表明 设计 方案 不 可 接受 , 需 重 新 调整 约束 条 件 或 各 分 目标 函数 的 临界 
值 ; 另 外 ,这 种 方法 易于 处 理 目标 函数 不 是 越 大 越 好 也 不 是 越 小 越 好 的 情况 。 


习题 


6-1 求 线性 规划 问题 : 
min 天 (天 ) 一 一 工 ! 一 27s 
st 2 十 2 
二 3 和 6 
jy 
6-2 求 线性 规划 问题 : 
min f(X)=—27z— zs 
sut 3zi 十 5zz 十 zs 一 15 
6zi 十 27zz 十 zi 一 24 


TX] 9 TI29 Ta3 9 Th4 之 0 
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6-3 


6-4 
6-5 


6-6 


用 单纯 形 法 求 下 列 线性 规划 问题 : 
min 大 (下 ) 王 一 3zl 一 zz 一 2zs 
5 t. Ti 二 二 zyR20 
(1) zi+2r5 33sSE0 
22 十 2z2 十 za 委 60 
ZiyZayZs 之 0 
还 过 (ND —3n 205— ma 二 ma 
s. t. 3Xx1 十 2X; 十 Xs 三 15 
(C2) 5zi 十 zz 十 3zs 一 20 
zl 十 2zz 十 3zs 十 zi 一 10 
2 过 0 
常用 的 约束 非 线性 离散 变量 的 优化 方法 有 哪些 ? 
现 有 一 块 边 长 为 1 m 的 正方 形 铁 板 ,在 四 角 处 都 截 去 边 长 相等 的 小 正方 形 并 折 成 一 个 
无 盖 的 箱子 , 问 如 何 去 截 才能 获得 容积 最 大 、\ 质 量 最 小 的 箱子 ? 试 建立 该 问题 的 数学 模 
型 ,假设 铁 板材 质 均匀 , 面 密度 为 1 质量 单位 /ms? 。 
求 多 目标 优化 问题 ， 
VY 一 minLzizaz， 一 Zuz8] 
| t. 好 十 邓 一 1 
TaoZzi2Z0 


利用 线性 加 权 法 进行 求解 ,要 求 权 系数 分 别 为 wi 二 0.3 和 wi 二 0.7。 
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当 传统 优化 方法 不 能 满足 求解 某 些 工程 问题 时 ,人 们 开始 把 注意 力 转向 另 一 类 有 别 于 传 
统 优化 方法 的 启发 式 算 法 。 由 于 这 类 算法 对 多 约束 、 多 目标 和 非 线 性 问题 求解 的 有 效 性 ,从 而 
获得 迅速 发 展 ,并 逐渐 成 为 解决 复杂 工程 优化 问题 的 有 力 工具 ,我 们 把 这 类 优化 方法 统称 为 现 
代 优 化 方法 。 

现代 优化 方法 主要 有 模拟 退火 算法 (simulated annealing)、 遗 传 算 法 (genetic algo- 
rithms) ,神经 网 络 算法 (neural networks)、 进 化 算法 (evolutionary programming) 等 。 这 类 算 
法 的 共同 点 是 它们 都 是 通过 揭示 和 模拟 自然 现象 和 过 程 , 并 综合 运用 数学 .生物 进化 .人 工 智 
能 、 神 经 科学 和 统计 学 等 学 科 所 构造 的 算法 。 

本 章 介 绍 其 中 发 展 比较 成 熟 的 两 种 现代 优化 方法 :遗传 算法 和 BP 神经 网 络 算法 ,以 及 它 
们 在 机 械 优化 设计 中 的 应 用 。 


7.1 遗传 算法 


遗传 算法 (genetic algorithms) 简称 GA ,最早 是 由 美国 科学 家 J，H. Holland 教授 在 1975 
年 提出 来 的 。 它 是 基于 进化 规律 的 一 种 模拟 生物 进化 过 程 的 随机 全 局 优化 搜索 方法 。 在 搜索 
时 由 代表 潜在 解 的 个 体 所 组 成 的 群体 经 历 一 系列 的 “遗传 ”“ 选 择 ”, 在 经 过 若干 代 后 ,最 好 的 
个 体 在 概率 意义 上 代表 全 局 最 优 解 。 优 化 计算 时 只 需 适 应 度 函 数值 ( 适 值 ) ,不 需要 导数 信息 ， 
适用 性 广 , 特 别 是 能 较 有 效 地 求解 常规 优化 方法 难以 解决 的 组 合 优化 问题 和 大 型 复杂 非 线 性 
系统 的 全 局 寻 优 问题 。 这 一 算法 将 生物 进化 原理 和 优化 技术 及 计算 机 技术 融合 在 一 起 ,属于 
一 种 新 的 智能 优化 方法 。 


7.1.1 遗传 算法 原理 


生物 的 进化 是 一 个 依照 群体 遗传 与 自然 选择 机 理 进 行 的 过 程 , 将 有 利于 生存 的 基因 遗传 
给 下 一 代 , 含 不 利于 生存 的 基因 的 个 体 产生 子 代 机 会 较 小 ,因而 会 逐渐 消亡 , 即 适 者 生存 , 劣 者 
淘汰 。 基 于 这 一 原理 ,GA 搜索 首先 是 利用 随机 方法 产生 一 初始 群体 (祖先 )。 和 群体 中 的 每 个 
个 体 称 为 染色 体 , 是 一 串 符号 ,比如 一 个 二 进 制 字符 串 , 它 对 应 着 优化 问题 的 一 个 设计 向 量 ( 即 
一 个 可 能 解 )。 染 色 体 的 最 小 组 成 元 素 称 为 基因 ,如 二 进 制 字符 串 的 一 位 。 基 因 与 设计 参数 变 
量 的 关系 ,取决 于 算法 的 编码 方法 。 例 如 ,采用 实数 编码 时 ,基因 即 对 应 某 一 设计 参数 变量 : 采 
用 二 进 制 编码 时 ,若干 个 基因 对 应 一 个 设计 参数 变量 。 然 后 ,在 搜索 过 程 中 ,这 些 染 色 体 通过 
杂交 、 变 异 操作 不 断 遗 传 进化 ,产生 下 一 代 , 即 称 为 后 代 。 而 新 一 代 群 体形 成 是 按照 优胜 劣 汰 
的 原则 对 染色 体 进行 选择 ,相对 好 的 个 体 被 选中 的 概率 高 ,从 而 得 以 繁殖 ,相对 差 的 个 体 将 趋 
于 死亡 。 因 此 ,通过 选择 、 杂 交 、 变 异 等 过 程 ;使 群体 的 整体 性 能 趋 于 改善 ,经 过 若干 代 繁衍 进 
化 就 可 使 群体 性 能 趋 于 最 佳 。 

图 7-1 表示 遗传 算法 的 主要 过 程 。 在 当代 群体 中 ,使 用 解码 后 设计 向 量 的 适应 度 函 数值 
评价 该 代 中 的 每 个 染色 体 ,按照 适 值 的 概率 分 布 选择 新 群体 ,然后 ,通过 变异 和 杂交 算 子 改变 
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图 7-1 遗传 算法 过 程 
新 群体 中 的 染色 体 , 产 生 后 代 。 如 果 在 经 过 若干 代 后 ,观察 不 到 更 进一步 的 改进 ,最 好 染色 体 
就 作为 一 个 可 能 的 全 局 最 优 解 。 通 常 根据 工程 实际 问题 及 计算 速度 和 资源 情况 确定 一 固定 代 
数 ,在 循环 结束 后 停止 计算 。 


7.1.2 遗传 算法 的 一 些 基 本 操作 


1. 编码 和 解码 

从 设计 空间 向 遗传 空间 (由 染色 体 个 体 组 成 ) 的 映射 称 为 编码 ,反之 称 为 解码 。 优 化 时 首 
先 要 将 设计 变量 X 表示 为 适合 于 遗传 算法 操作 的 二 进 制 码 串 , 即 染色 体 。 

例如 欲求 函数 7CX) = 大 zz) 的 最 大 值 。 令 设计 参数 变量 x; 的 变化 范围 为 Lzmn， 
Ximaxj; 即 zx; 为 域 也 ;一 [ai ,bi;] 二 [ximin yzimsxj 刁 R 内 的 一 个 值 ,也 就 是 对 所 有 zx; EDi, f(zi,*…， 
Zz,) 之 0。 假定 以 某 个 要 求 的 精度 来 优化 函数 f: 这 里 取 设 计 参 数 变 量 小 数 点 后 第 6 位。 显然 ， 
为 达到 这 样 的 精度 ,每 个 域 D; 应 该 被 分 割 成 (5; 一 a;)X10° 份 等 长 度 的 区 间 。 令 m; 表示 使 (0 一 
a;) X10 过 2” 一 1 成 立 的 最 小 整数 , 则 对 每 个 变量 x; ,由 串 长 为 m; 的 二 进 制 编码 表达 能 满足 精度 
要 求 。 因 此 ,下 面 的 公式 对 应 于 每 一 个 二 进 制 串 substring; 的 设计 参数 变量 的 十 进 制 值 


Zi 一 心 十 decimal (substring;) * 人 全 (二 1 2 3 ,Nn) (7-1) 


其 中 decimal (substring;) 表 示 二 进 制 串 的 十 进 制 值 。 

设计 参数 变量 z; 的 编码 精度 为 

A;= (6b;—a;)/(2™—1) (7=20 

由 式 (7-2) 可 见 ,m; 长 则 编码 精度 高 ,但 是 使 遗传 算法 的 复杂 性 增加 。 

显然 ,设计 参数 变量 的 码 串 长 度 m; 不 仅 与 计算 精度 有 关 ,而且 与 其 变化 范围 有 关 。 各 设 
计 参 数 变量 可 以 根据 实际 工程 需要 取 不 同 的 计算 精度 。 

最 后 将 所 有 表示 设计 参数 变量 的 二 进 制 码 串 接 起 来 组 成 一 个 长 的 总 二 进 制 码 串 构成 染色 
体 v, 它 就 是 遗传 算法 可 以 操作 的 对 象 。 这 样 , 代 表 一 个 潜在 解 的 染色 体 二 进 制 串 总 长 度 为 m 


= 之 1 前 7721 位 对 应 区 间 [Lai ;bi 里 的 一 个 值 Xl ,随后 的 mlz 位 对 应 区 间 La; ,b; ] 里 的 一 个 值 


zz"…*… 最 后 的 m, 位 对 应 区 间 La, ,6b, 里 的 一 个 值 x, 。 
2, 初始 群体 的 产生 
优化 时 群体 规模 即 染 色 体 总 数 Po 是 一 个 必须 事先 人 为 确定 的 量 。 群 体 规模 越 大 ,GA 所 
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处 理 的 模式 越 多 ,陷入 局 部 解 的 可 能 性 越 小 , 即 不 易 陷 入 未 成 熟 收敛 。 但 规模 过 大 会 使 计算 量 
大 大 增加 ,影响 算法 效率 。 实 际 应 用 时 需 按 具体 问题 来 定 。 

至 于 初始 群体 确定 方法 一 种 是 完全 随机 的 方法 ,如 用 掷 硬 币 的 方法 ,正面 表示 1, 反 面 表 
示 0, 不 断 掷 , 依 次 确定 染色 体 各 个 基因 值 , 直 至 产生 Po 个 染色 体 。 若 对 所 求解 的 问题 具有 某 
些 最 优 分 布 的 先 验 知识 ,可 首先 将 这 些 先 验 知识 转变 为 必须 满足 的 一 组 要 求 ,在 满足 这 些 要 求 
下 随机 地 选取 样本 。 例 如 , 若 知 最 优 解 在 问题 空间 中 的 分 布 范围 ,可 在 此 范围 内 选择 初始 
群体 。 

3 染色 体 的 评价 

适应 度 函 数 是 评价 各 和 群体 或 个 体 是 否 优化 .先进 的 准则 ,由 此 测定 染色 体 对 目标 的 适应 
性 。 在 优化 时 是 通过 计算 染色 体 适 值 大 小 来 评价 其 好 坏 的 ,因此 要 构造 适应 度 函 数 。 对 于 机 
构 参 数 优化 问题 ,目标 函数 可 以 直接 作为 适应 度 函数 。 所 以 ,简单 的 适应 度 函数 可 以 用 一 个 公 
式 来 表示 ,如 误差 平方 积分 、 二 次 型 性 能 指标 等 。 对 于 复杂 系统 ,可 能 要 对 系统 仿真 ,由 多 个 目 
标 值 来 判断 ;或 者 要 通过 一 系列 规则 要 求 , 经 过 多 个 步骤 才能 求 得 适 值 ,而 不 能 用 公式 来 表达 。 

遗传 算法 一 般 讨 论 的 问题 都 是 适 值 为 正 且 求 最 大 值 问题 。 若 目标 函数 / 有 可 能 为 负 , 则 
可 通过 加 法 机 制 来 调整 , 即 加 入 某 个 适当 大 的 正常 数 C( 计 算 时 取 群 体 中 的 最 大 适 值 或 某 一 足 
够 大 的 数 ) 使 之 为 正 ,也 就 是 问题 转化 为 


maxf(X)—>max{! f(X)+C)} (7-3(a)) 
如 果 优 化 问题 是 求 函 数 f 的 最 小 值 , 它 等 同 于 求 函 数 g 的 最 大 ,其 中 g== 一 了 , 即 
min f(X)=max g(X)=max{— f(X))} (7-3Cb)) 


4. 遗传 操作 

遗传 操作 是 遗传 算法 的 核心 ,其 重要 的 特点 是 有 向 随机 的 。 操 作 的 效果 与 效率 取决 于 编 
码 的 方式 、 群 体 规模 、 初 始 种 群 . 适 应 度 函 数 及 各 个 遗传 操作 概率 。 

(1) 选择 -复制 。 选 择 -复制 操作 的 目的 是 选 出 群体 中 优质 (如 适 值 高 ) 的 个 体 ,淘汰 劣质 
个 体 ,形成 新 的 种 群 。 

对 基于 适 值 的 概率 分 布 选择 新 群体 的 选择 过 程 , 称 为 正比 选择 或 轮 盘 选择 ,其 基本 思想 是 
每 个 染色 体 的 选择 概率 ( 即 生存 概率 ) 正 比 于 它 的 适 值 。 通 常 使 用 如 下 方法 构造 这 样 一 个 
轮 盘 。 

人 @ 计算 每 个 染色 体 v; 的 适应 值 eval(v) (一 1,2,，…,Po); 

@ 计算 群体 的 总 适 值 


不 一 Srewaigw] (7-4) 
@ 计算 每 个 染色 体 v 的 选择 概率 (生存 概率 ) 为 


pi=eval(v )/F (i=1,.,Po) (7-5) 
@ 计算 每 个 v 染色 体 的 累积 概率 为 


gh 5 D2, (一 1,… ,Po) (7-6) 
j=1 


对 轮 盘 转动 Po 次 ,每 次 按照 下 面 的 方法 为 新 群体 选择 一 个 单个 的 染色 体 :产生 一 个 在 区 
间 [0,1] 里 的 随机 数 7, 如 果 rqi ,选择 第 一 个 染色 体 mm 加 入 新 群体 ;否则 选择 使 9;-1 二 r<g; 
成 立 的 第 i 个 染色 体 v;(2<i<Po) 加 入 新 群体 。 

很 明显 ,这 样 适 值 高 的 染色 体 将 有 可 能 被 选择 一 次 以 上 。 这 是 符合 遗传 算法 的 模式 定理 
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的 :最 好 染色 体 得 到 多 个 拷贝 ,中 等 染色 体 保持 平稳 ,最 差 染 色 体 死亡 。 

复制 操作 对 尽快 收敛 到 优化 解 具有 很 大 影响 ,但 它 不 能 产生 新 的 模式 结构 ,而 是 使 高 于 平 
均 适 值 的 模式 数量 增长 很 快 。 

(2) 杂交 操作 。 杂 交 操 作 是 通过 结合 两 个 父母 代 的 结构 特征 生成 两 个 子 代 个 体 。 

杂交 是 遗传 算法 的 一 个 重要 的 重组 算 子 ,杂交 率 p. 是 算法 的 一 个 参数 ,此 概率 给 出 预计 
要 进行 杂交 的 染色 体 个 数 为 p.* Po 。 

杂交 操作 按 下 面 方法 处 理 : 

@ 对 新 群体 中 的 每 个 染色 体 依 次 产生 一 个 在 区 间 [0,1] 里 的 随机 数 r; 

@ 如 果 rp. ,选择 给 定 的 染色 体 进 行 杂交 。 

在 选 完 进 行 杂 交 的 染色 体 后 ,随机 地 对 被 选 定 的 染色 体 进行 配对 。 如 果 选 择 的 染色 体 数 
是 偶数 ,可 以 很 容易 地 配对 。 如 果 选 择 的 染色 体 数 为 奇数 ,可 以 加 入 一 额外 的 染色 体 或 者 移 走 
一 被 选 出 的 染色 体 , 这 种 选择 同样 是 随机 的 。 对 染色 体 对 中 的 每 一 对 ,产生 一 个 在 区 间 [1,m 
一 1jCm 为 总 长 一 一 染色 体 的 位 数 ) 里 的 随机 整数 pos。 数 pos 表示 杂交 点 的 位 置 。 如 两 个 配 
对 染色 体 





(bibz*"*DbposDbposti bn) 和 C1 cee CposCpost1 和 cm) 
则 杂交 操作 后 它们 的 子 代 为 
(bibz "DposCpost1"" Cm) (ceca :bpos Dpost1 bm ) 
并 且 被 子 代 所 替换 。 
例如 ,对 于 如 下 两 个 染色 体 , 若 随机 断 点 选 在 第 17 个 基因 之 后 : 
m= [L000001010100101001 101111011111110] 
ys = [001110101110011000 0000101001000] 
交换 双亲 上 断 点 的 右 端 后 得 到 的 两 个 后 代 如 下 : 
w=[000001010100101000 0000101001000] 
"一 [001110101110011001 101111011111110] 
杂交 过 程 是 染色 体 码 串 之 间 既 有 组 织 又 随机 的 (杂交 点 及 谁 与 谁 配对 均 是 随机 的 ) 过 程 ， 
它 能 创建 新 的 结构 模式 ,同时 又 最 低 限 度 地 破坏 复制 过 程 所 选择 的 高 适 值 模式 ;这样 就 会 使 群 
体 搜索 空间 加 大 ,使 子 代 个 体 更 具 多 样 性 。 例 如 在 复制 操作 中 ,车 群体 中 有 一 个 相对 其 他 个 体 
适 值 较 好 的 个 体 ,复制 将 促使 它 不 断 延 续 下 去 ,即使 该 个 体 在 整个 搜索 空间 仍 是 较 平庸 的 ,这 
将 导致 群体 趋向 ,而 杂交 操作 会 打破 这 样 的 局 面 。 杂 交 操 作 是 产生 新 个 体 的 最 重要 的 操作 。 
(3) 变异 操作 。 变 异 也 是 一 个 重要 的 遗传 算 子 ,是 在 一 位 一 位 (bit-by-bit) 基 础 上 执行 的 。 
变异 操作 是 产生 新 个 体 的 辅助 方法 。 
作为 遗传 算法 的 另 一 个 参数 , 设 变 异 率 为 pa, 则 可 以 预计 的 变异 位 数 为 pw。Po。 因 此 变 
异 以 等 于 变异 率 的 概率 改变 一 个 或 若干 个 基因 。 整 个 群体 中 所 有 染色 体 中 的 每 一 位 都 有 均等 
的 机 会 经 历 变异 。 
常用 的 基于 二 进 制 编码 的 基本 变异 操作 过 程 是 对 群体 中 个 体 随机 选 定 基因 位 ,并 按 概率 
Pm 将 这 些 基 因 位 上 的 值 取 反 , 即 从 0 变 为 1 或 者 相反 。 若 变异 率 ps 不 是 固定 的 ,而 是 随 群 体 
中 个 体 多 样 性 程度 进行 调整 , 则 就 是 自 适应 变异 操作 。 变 异 操 作 的 目的 是 使 GA 保持 群体 多 
样 性 ,防止 丢失 一 些 有 用 的 遗传 模式 。 当 然 它 也 可 能 破坏 有 用 的 模式 ,因此 如 通常 取得 很 
小 。 为 了 使 群体 具有 多 样 性 ,同时 收敛 又 能 较 快 ,可 以 开始 时 将 Po 取得 大 一 些 , 在 一 代 代 遗 
传 操作 过 程 中 不 断 丢掉 一 些 显然 较 差 的 个 体 。 
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变异 操作 按 如 下 方法 处 理 , 对 于 每 个 位 : 
@ 产生 在 区 间 里 [0,1] 的 一 随机 数 7; 
@ 如 果 r 二 pa, 变异 此 位 。 
例如 ,假设 以 下 染色 体 v 的 第 18 个 基因 被 选 来 变异 ,该 基因 为 1, 故 将 其 变 为 0, 于 是 变异 
后 染色 体 为 : 
"一 [ 100110110100101101 000000010111001 ] 
+ 
v=[100110110100101100 000000010111001 ] 


7.1.3 遗传 算法 步骤 及 实例 


遗传 算法 整个 流程 框图 如 图 7-2 所 示 。 在 初始 群体 确定 后 ,依次 进行 选择 .杂交 和 变异 等 
遗传 操作 ,产生 新 的 群体 ,并 进行 染色 体 的 评价 。 以 后 算法 只 是 上 述 步骤 的 循环 重复 。 
输入 参数 :G 王 0, 工 ，Po ,n,p. ,pn 
输入 边界 : (ai,b;) i 二 1,2,**…,n 
初始 群体 产生 ( 共 Po 个 染色 体 ) 
For G 二 1 To T( 循 环 工 代 ) 
杂交 操作 
变异 操作 


最 优 个 体 保 存 操作 


输出 最 优 解 


图 7-2 遗传 算法 框图 


为 理解 上 述 整 个 过 程 ,以 无 约束 优化 以 下 二 维 函 数 为 例 : 
max f(zxi,x»)=21.5+zisin(4pzi) 二 x2sin(20pz;) 
参数 变量 区 间 为 —3;0&<z1R12, 1 
4. 1 过 x; 二 5.8 
目标 函数 的 三 维 图 形 呈 现 多 峰 , 非 常 复杂 ,如 图 7-3 所 示 。 设 定 群 体 规模 Po 二 10, 遗 传 算 
子 的 概率 为 p. 二 0.25、ps 二 0.01, 则 算法 过 程 如 下 。 
1. 编码 和 解码 
首先 ,将 决策 变量 编码 为 二 进 制 串 。 假 设 zx， 和 zs 需要 的 精度 都 是 小 数 点 后 4 位 ,zi 的 值 
域 是 Laj ,6b;j], 则 zj; 所 需要 的 二 进 制 编码 子 串 长 mx; 满足 下 式 
3 二 二 (为 一 57X104 有 2 一 1 
因此 ,对 变量 zi 的 定义 域 区 间 [ 一 3.0,12. 1] 应 该 至 少 被 分 成 等 距 区 间 数 
(12.1 一 (一 3.0))X10000 王 151000 
又 因为 2” 二 151000 之 2 ,所 以 染色 体 的 第 一 部 分 需要 位 数 : mi 二 18 
同 理 , 对 于 变量 x; ,精度 要 求 自 变量 域 长 度 区 间 应 该 至 少 被 等 分 成 
(5. 8 一 4. 1) X10000=17000 
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7-3 优化 目标 函数 


因 2 <17000 委 2 , 即 染 色 体 的 第 二 部 分 需要 位 数 :m? 一 15 
所 以 ,染色 体 的 总 长 度 ( 基 因数 目 ) :mm 一 za 十 mo 一 33 
即 前 18 位 表示 zi 和 后 15 位 表示 z; 。 
对 于 解码 ,如 有 一 染色 体 v 如 下 : 
v=[010001001011010000 111110010100010]] 
| 一 一 18 位 一 一 一 | 一 一 z;15 位 一 >| 
则 对 应 的 变量 zx; 和 zx; 的 十 进 制 码 为 
Xl 二 70352， zz 一 31960 
而 十 进 制 值 按 式 (7-1) 计 算 分 别 为 
m= 0 I—( 30 一 1 =1. 0524 
zz 一 4.1 十 31960X(5. 8 一 4.1)V/(25 一 1) 一 5.7553 
即 对 应 于 二 [xi,zx2j] 二 [1. 0524,5.7553]。 因 此 ,该 染色 体 的 目标 函数 值 为 : f(X) = 
f(1.0524,5.7553) =20. 252640。 
2. 初始 种 群 
每 一 染色 体 中 的 33 位 都 是 随机 初始 化 的 ,假定 经 过 初始 化 过 程 后 ,随机 产生 的 初始 种 群 
如 下 : 
m=[ 000001010100101001 101111011111110 ] 
v=[ 001110101110011000 000010101001000 ] 
vs=[ 111000111000001000 010101001000110 ] 
w=[ 100110110100101101 000000010111001 ] 
[ 000010111101100010 001110001101000 
[ 111110101011011000 000010110011001 
[ 110100010011111000 100110011101101 
[ 001011010100001100 010110011001100 
[ 111110001011101100 011101000111101 
vo =[ 111101001110101010 000010101101010 ] 








3. 评价 
首先 将 上 述 初 始 种 群 染 色 体 w 二 进 制 串 解码 为 十 进 制 ; 
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由 二 [zyzs] 一 [一 2.687969,5.361653] 
mm 一 [ziyzs] 一 [0.474101,4.170144] 
y=[zi,z = [10.419457,4.661461] 
由 一 [ziyz?] 一 [6.159951,4.109598] 

大 三 [zi ,zx |]= [一 2. 301286 ,4.477282] 
vo =[zx1,7x, |= [11.788084,4.174346] 
v=[zx1,7x2 |= [9.342067,5.121702] 
一 [ziyz?] 一 [一 0.330256 ,4.694977] 
m 一 [Lzr,z*] 王 [11.671267,4. 873501] 
wo 一 [ zzo] 王 [11.446273,4. 171908] 


“ I23 * 


然后 计算 目标 函数 值 fA(X,), 并 将 目标 函数 转换 为 适 值 。 这 里 简单 地 取 目 标 函数 值 为 适 
值 :eval(y)= 二 Af(X) ,k==1,2,3,…，Po。 所 以 得 到 各 染色 体 的 适 值 为 


eval(y)=f(—2.687969,5. 361653)=19. 805119 
eval(v,)=f(0.474101,4.170144)=17. 370896 
eval(v;)=f(10. 419457 ,4. 661461)=9. 590546 
eval(v,)=f(6.159951,4.109598)=29. 406122 
eval(yvs )=f(—2.301286,4.477282)=15. 686091 
eval(vs )=f(11.788084,4.174346)=11. 900541 
eval(v )=f(9.342067,5.121702)=17.958717 
eval(w )= f(—0.330256,4.694977)=19.763190 
eval(w )= f(11.671267,4. 873501)=26. 401669 
eval(vio ) 王 大 (11.446273,4. 171908) 王 10. 252480 


显然 ,染色 体 Va 是 最 好 的 ,而 染色 体 w 是 最 差 的 。 


4. 选择 


采用 转 轮 法 作为 选择 方法 ,根据 与 适 值 成 正比 的 概率 选 出 新 的 种 群 。 


构成 ,计算 按 式 (7-4) 一 式 (7-6) 进 行 。 
@ 计算 种 群 中 所 有 染色 体 的 适 值 的 和 : 


10 * 
F= Deval(w) = 178. 135372 
k=] 


@ 对 各 个 染色 体 w ,计算 选择 概率 pi: 


p1=0. 111180， 
ps =0,066806, 


pi=0.097515, p;3=0.053839, 加 一 0. 165077， 
pr=0.100815, ps=0.110945, z 加 一 0. 148211， 


@ 对 各 个 染色 体 ,计算 累积 概率 qx : 


gq =0.111180, 
gs =0. 582475, 


q 一 0.208695， 由 一 0.262534， gi;=0.427611, 
dj 一 0.683290， 四 一 0.794234， go 一 0.942446， 


转 轮 法 由 以 下 几 步 


ps =0. 088057 
pio =0.057554 


gs =0.515668 
Gilo 一 1 000000 


@ 接着 ,准备 转动 轮 盘 10 次 ,每 次 按 如 下 方式 选 出 一 个 染色 体 来 构造 新 的 种 群 。 
步骤 1: 在 [0,1] 区 间 产 生 一 个 均匀 分 布 的 伪 随 机 数 ~。 
步骤 2: 若 r<qi , 则 选 第 一 个 染色 体 ;否则 ,选择 第 k 个 染色 体 ww (2 入 上 魏 10) ,使 得 qk—1 


二 rq; 成 立 。 


设 产 生 的 [0,1j 间 的 10 个 随机 数 序 如 下 : 
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0. 301431， 0. 322062， 0.766503， 0. 881893， 0. 350871 

0.583392, 0.177618， 0. 343242， 0. 032685， 0. 197577 
第 一 个 数 x 二 0.301431 大 于 qs 小 于 qs ,这 表示 染色 体 w 被 选 来 构造 新 种 群 ;第 二 个 数 7; 二 
0. 322062 也 大 于 gs 小 于 gs ,表示 染色 体 再 次 被 新 种 群 选中 ,重复 以 上 操作 ,最 后 选 出 了 如 下 
新 的 种 群 : 


由 一 [ 100110110100101101 000000010111001 ] 一 mw 
几 王 [ 100110110100101101 000000010111001 ] 一 mw 
几 王 [ 001011010100001100 010110011001100 ] 一 vs 
w=[ 111110001011101100 011101000111101 ] 一 wm 
态 二 [ 100110110100101101 000000010111001 ] 一 wm 
v=[ 110100010011111000 100110011101101] 一 mw 
由 一 [ 001110101110011000 0000101001000 ] 一 wm 





v=[ 100110110100101101 000000010111001 ] 一 wm 
”=[ 000001010100101001 101111011111110 ] 一 
vo =[ 001110101110011000 000010101001000 ] 一 mw 
5. 杂交 
因 设 杂交 率 p. 二 0.25 , 即 平均 有 25% 染 色 体 将 经 历 杂 交 。 首 先 对 新 群体 中 的 每 个 染色 
体 ,产生 一 在 区 间 [0,1] 里 的 随机 数 x, 如 果 7r 二 0. 25, 则 选择 给 定 的 染色 体 进行 杂交 。 现 假定 
随机 数 序 列 为 
0. 625721， 0. 266823， 0.288644, 0,295114, 0. 163274 
0.567461, 0. 085940， 0. 392865， 0.770714， 0. 548656 
于 是 染色 体 %: 和风 被 选 和 人 参加 杂交 。 再 对 配对 的 染色 体 产生 一 个 随机 的 整数 pos 作为 断 
点 ,posEL1,32] (因为 33 是 染色 体 的 长 度 ) 。 现 假设 产生 的 pos 王 1, 两 染色 体 自 第 1 位 后 切 
断 ,并 交换 断 点 右 端 , 故 
态 二 [ 100110110100101101 000000010111001 ] 
芒 二 [ 001110101110011000 0000101001000 ] 
+ 
由 一 [ 101110101110011000 0000101001000 ] 
由 一 [ 000110110100101101 000000010111001 ] 


6. 变异 
因 设 变异 率 加 三 0. 01, 而 种 群 中 共有 mX Po 二 33X10 二 330 个 基因 ,所 以 ,可 以 预计 每 代 
平均 有 3. 3 个 基因 发 生变 异 。 为 使 每 个 基因 有 均等 的 机 会 发 生变 异 , 需 要 对 群体 中 的 每 一 基 
因 位 产生 区 间 [0,1j 内 均匀 分 布 的 随机 数 序列 (k= 二 1,2,3,…,330)。 如 果 7 过 0. 01, 则 变异 此 
位 。 设 在 运行 例子 中 ,总 共产 生 4 个 小 于 0.01 的 数 ,变异 位 关系 和 产生 的 随机 数 如 表 7-1 所 示 。 
表 7-1 变异 操作 过 程 









随 机 数 





105 0. 009857 
164 0.003113 
199 0.000946 


0.001282 
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所 以 ,变异 后 的 新 种 群 如 下 : 
邮 王 [100110110100101101 000000010111001 ] 
鸣 =[ 100110110100101101 000000010111001 ] 
一 [ 001011010100001100 010110011001100 ] 
=[ 111111001011101100 011101000111101 ] 
v=[ 101110101110011000 000010101001010 ] 
vs=[ 110100010011111000 100110011101101] 
好 一 [ 100110110100101101 000000010111001 ] 
vs=[ 100110110100101101 000000010111001 ] 
w=[ 000001010100101001 101111011111110 ] 
vio =[ 001110101110011000 000010101001010 ] 
至 此 ,完成 了 遗传 算法 循环 过 程 的 一 次 迭代 ( 即 算法 完成 一 代 ) 。 
接着 检查 新 群体 ,对 每 个 染色 体 进行 解码 ,并 计算 解码 后 的 适应 度 函 数值 ,得 
eval(v1)= f/f(6.159951,4.109598)=29. 406122 
eval(vs)=/(6.159951,4.109598)=29. 406122 
eval(ys)=/f(—0.330256,4. 694977)=19.763190 
eval(v)=f(11. 907206,4. 873501)=5.702781 
eval(vs)=/f(8.024130,4.170248)=19. 91025 
eval(vs)= f/f(9. 342067;5. 121702)=17. 958717 
eval(v7)=f(6.159951,4.109598)=29. 406122 
eval(vs)=/(6.159951,4. 109598)=29. 406122 
eval(vs)=f(—2.687969,5.361653)=19. 805119 
eval(v1o)=f(0.474101,4.170248)=17. 370896 
由 此 可 见 ,新 群体 的 总 适 值 下 为 218. 1354, 高 于 先前 群体 的 总 适 值 178. 1353, 但 是 在 这 一 轮 
中 最 好 染色 体 的 适 值 还 未 起 变化 。 
重复 上 述 迭 代 , 并 跟踪 进化 过 程 中 的 最 好 个 体 : 在 遗传 算法 的 实现 中 ,通常 保存 "曾经 最 
好 ”个 体 。 这 种 方法 ( 称 为 精华 模型 ) 将 报告 整个 过 程 的 最 好 值 ,而 不 只 是 最 终 群体 的 最 好 值 。 
实验 运行 在 1000 代 后 结束 ,在 第 419 代 就 得 到 了 最 佳 的 染色 体 : 
多 =[111110000000111000111101001010110] 


对 应 的 设计 参数 变量 : z =11.631407, zx? =5.724824 
适 值 : eval(v* )=f(11.631407,5.724824)=38. 818208 
目标 函数 值 : f(X"* )=38. 818208 


7.1.4 ”遗传 算法 在 机 械 优化 设计 中 的 应 用 


机 械 优化 设计 的 最 大 特点 是 问题 的 非 线性 及 多 峰 性 , 它 的 目标 函数 复杂 ,采用 传统 的 算法 
往往 搜索 不 到 全 局 最 优 解 。 这 时 采用 遗传 算法 非常 有 效 , 它 不 要 求 目标 函数 和 约束 的 可 微 性 ， 
计算 效率 比较 高 ,搜索 结果 的 最 好 个 体 在 概率 意义 上 代表 了 全 局 最 优 解 。 但 由 于 机 械 设计 的 
特殊 性 , 需 对 算法 的 具体 操作 做 一 些 改进 。 

1. 编码 

遗传 算法 用 于 机 械 优化 设计 时 ,对 算法 中 的 染色 体 即 设计 向 量 X, 常 采用 另 一 种 编码 方 
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法 一 一 实数 编码 ( 浮 码 ) ,也 就 是 直接 采用 实数 表达 ,每 个 染色 体 编 码 为 一 个 与 解 向 量 维 数 相 同 
的 实 向 量 , 每 个 设计 参数 xz; 即 作为 一 个 基因 。 实 数 编码 可 以 避免 在 染色 体 评价 过 程 中 的 二 进 
制 编码 和 解码 过 程 , 提 高 算法 的 运行 效率 。 但 是 ,此 时 算法 中 的 杂交 和 变异 操作 与 前 述 有 很 大 
不 同 。 

2. 杂交 

设 初始 群体 中 各 染色 体 依据 设计 参数 的 边界 (zi ,zi) 约 束 随机 产生 , 即 取 染 色 体 XX 的 基 
因为 

Xi=Xi 二 rand( )*» (zt—zxi); k=1,2,.…,n (7-7) 

其 中 :随机 函数 rand( ) 取 在 区 间 [0,1] 内 的 随机 数 。 显 然 ,这 样 产生 的 染色 体 均 满足 边界 约束 
条 件 。 那么 遗传 进化 操作 时 ,可 以 采用 算术 杂交 算 子 ,使 产生 的 后 代 仍 满足 边界 约束 条 件 。 

算术 杂交 操作 是 设 父 代 染色 体 Xi 、X; , 则 杂交 后 产生 的 子 代 染色 体 为 

Xi 一 MX 十 (1 一 1) 
bE pb, fn DD 

式 中 :4 是 (0,1) 内 的 随机 数 。 这 种 杂交 是 凸 杂 交 , 其 特点 为 如 父 代 Xi 、X 均 属于 凸 集 , 则 子 代 
X1、X 也 均 属于 该 凸 集 。 由 于 边界 约束 是 凸 集 ; 所 以 杂交 结果 仍 满足 边界 约束 。 

3. 变异 

在 同样 方法 产生 初始 群体 后 , 若 变异 采用 非 均匀 变异 算 子 ,那么 对 于 选 定 的 父 代 X, 如 其 
基因 zi 被 选 作 变异 , 则 生成 的 后 代为 

X=[zx ze xz Di] 
其 中 :zy 随机 地 按 如 下 两 种 可 能 的 机 会 变换 ' 
XZ% 二 Xk 十 A(t ,Xt 一 zi) 如 随机 数 为 0; 
ZX4 二 Zh 一 A(t,Xxh 一 Zz ) 如 随机 数 为 1; 

这 里 ,zt 和 xz 分别 是 zx 的 上 下 界 ; 函 数 A(i,y) 返 还 区 间 [L0,yj] 里 的 一 个 值 , 且 当 代数 t 增 加 
时 函数 A 以 接近 于 0 的 概率 增加 。A(t,y) 的 函数 形式 可 以 参考 相关 文献 。 这 种 变异 的 特点 
是 如 果 父 代 在 上 下 界 域内 , 则 变异 产生 的 后 代 也 在 该 域内 。 

可 见 , 只 要 杂交 和 变异 前 父 代 是 满足 边界 约束 的 , 因 边界 约束 形成 的 空间 是 凸 集 , 故 通过 
上 述 所 采用 的 杂交 和 变异 算 子 产生 的 后 代 也 必然 满足 边界 约束 。 因 此 ,在 遗传 算法 中 ,如 初始 


(7-8) 


(7-9) 


群体 在 设计 参数 的 上 下 边界 范围 内 产生 ,经 上 述 所 采用 的 遗传 算 子 可 保证 产生 的 后 代 仍 满足 ， 


边界 约束 ,这 样 把 边界 约束 从 约束 条 件 中 分 离 了 出 来 ,使 整个 搜索 过 程 中 只 需 惩罚 不 满足 性 能 
约束 的 染色 体 即 可 ,从 而 在 惩罚 函数 中 消去 了 边界 约束 的 影响 ,使 惩罚 函数 更 为 简单 ,并 可 以 
提高 优化 计算 效率 。 

4. 约束 条 件 处 理 

目前 遗传 算法 对 于 违反 约束 的 处 理 主要 有 四 种 。 死 亡 惩罚 策略 对 于 一 些 很 难 通过 一 般 遗 
传 因子 产生 可 行 解 的 问题 ,算法 耗费 大 量 的 机 时 去 评价 非法 个 体 ;修复 策略 用 特殊 的 修补 算法 
来 校正 所 有 产生 的 不 可 行 解 , 只 对 特定 问题 而 言 , 同 样 耗费 大 量 的 计算 ;改进 遗传 算 子 策略 通 
过 设计 专门 的 遗传 算 子 来 维持 染色 体 的 可 行 性 。 上 述 三 种 策略 无 法 考虑 可 行 域外 的 点 , 故 有 
第 四 种 也 是 常见 的 惩罚 策略 。 

惩罚 策略 类 似 于 常规 优化 方法 中 的 惩罚 函数 法 。 群 体 中 个 体 的 优 劣 也 就 是 个 体 适 值 一 般 
用 目标 函数 f(X) 来 评价 ,但 对 于 有 非 线 性 约束 条 件 的 数值 优化 问题 ,考虑 到 采用 惩罚 策略 ， 
所 以 需 把 惩罚 与 目标 函数 联系 起 来 重新 构造 适 值 评价 函数 。 下 式 为 目前 常用 的 适 值 函数 形式 
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eval(¥)=f(X). p(X) (7-10) 
Fe I | (7-11) 


式 中 :p(X) 为 自 适应 的 惩罚 函数 ,a 是 用 来 调节 惩罚 程度 的 参数 ,Ag;(X) 是 染色 体 X 对 第 ;个 
约束 的 违反 量 ,Agw 是 当前 群体 中 对 第 ; 个 约束 的 最 大 违反 量 。 惩 罚 函 数 的 设计 各 有 不 同 , 原 
则 是 违反 程度 越 大 ,惩罚 越 重 。 这 样 通过 第 罚 不 可 行 解 将 约束 优化 问题 转化 为 无 约束 优化 问 
题 来 处 理 。 因 此 ,惩罚 策略 允许 在 每 代 的 群体 中 保持 部 分 不 可 行 解 ,使 遗传 算法 搜索 可 以 从 可 
行 域 和 不 可 行 域 两 侧 来 达到 最 优 解 。 

其 中 合理 的 惩罚 因子 取 值 是 非常 困难 的 ,与 讨论 的 问题 有 关 ,一般 通过 试验 获得 。 有 时 调 
整 不 好 ,一 些 约束 不 满足 的 个 体 其 适 值 比 满足 约束 的 其 他 个 体 适 值 还 好 ,以 致 收敛 到 可 行 域 
外 。 有 特色 的 是 Powell 等 提出 附加 的 惩罚 项 ,对 不 可 行 个 体 惩罚 增加 ,使 它们 的 适 值 不 好 于 
可 行 个 体 中 最 差 值 。 对 于 机 械 设计 往往 在 约束 界面 上 取得 最 优点 ,这 样 处 理 任何 不 可 行 个 体 
会 丢失 很 多 有 用 信息 。 有 关 文 献 也 针对 这 一 问题 给 出 了 一 种 算法 。 

上 述 约束 处 理 主要 针对 不 等 式 性 能 约束 条 件 。 但 是 性 能 约束 中 有 一 类 特殊 的 机 构 存 在 约 
束 条件 ,如 不 满足 表示 机 构 不 成 立 , 以 致 目标 函数 f(X) 本 身 无 法 计算 ,例如 对 于 曲柄 摇 杆 机 
构 设 计 , 机 构成 立 条 件 可 表示 为 对 于 曲柄 任意 转角 ,在 机 构 运 动 计算 中 有 关 式 的 根 号 内 值 必须 
大 于 零 。 因 此 ,对 于 不 满足 机 构 存 在 约束 条 件 的 染色 体 , 因 机 构 不 存在 , 故 只 能 采用 拒绝 策略 ， 
即 重 新 产生 新 的 染色 体 取代 之 。 

此 外 对 于 等 式 约束 ,解决 方案 是 降 维 法 ,使 设计 变量 的 维 数 降低 ,并 且 消 去 等 式 约束 ， 
可 以 简化 优化 时 约束 条 件 的 处 理 。 至 于 不 等 式 边 界 约 束 ,采用 浮 码 时 可 通过 选择 杂交 和 变异 
方法 来 解决 。 


7.1.5 剑 杆 织 机 引 纬 机 构 参数 优化 设计 实例 
图 7-4 所 示 为 剑 杆 织 机 的 引 纬 机 构 简 图 , 它 是 平面 四 杆 机 构 、 空 间 RSSR 机 构 和 平面 定 轴 





7-4 剑 杆 织 机 引 纬 机 构 简 图 
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内 路 合 齿轮 机 构 串 联 而 成 的 组 合 机 构 。 其 工作 原理 是 主动 曲柄 AB 以 角速度 wi 顺 时 针 回 转 ， 
通过 六 杆 组 合 机 构 使 扇形 齿轮 六 往复 摆动 ,从 而 驱动 剑 轮 "使 剑 头 来 回 直 线 移动 ,实现 引 续 
运动 。 引 纬 规律 即 剑 头 运动 规律 对 于 引 纬 机 构 功能 的 实现 是 至 关 重 要 的 , 引 纬 机 构 的 设计 主 
要 是 实现 织造 工艺 所 要 求 的 引 纬 规律 。 该 机 构 的 引 纬 规律 是 由 两 套 连 杆 机 构 的 尺寸 所 确定 
的 。 因 连 杆 机 构 的 特性 限制 , 引 纬 规律 不 能 随意 设计 ,但 是 ,改变 连 杆 机 构 的 尺寸 设计 ,可 以 获得 
能 满足 要 求 的 剑 头 运动 规律 。 然 而 按 常 规 方法 设计 是 非常 困难 的 ,所 以 ,采用 优化 设计 方法 。 

解 ”首先 确定 该 机 构 结 构 参 数 与 剑 头 运动 规律 的 关系 ,可 按 如 下 方法 计算 : 

对 于 平面 四 杆 机 构 , 令 多 为 曲柄 与 连 杆 重 笃 共 线 时 作为 起 始点 的 曲柄 转角 ,其 他 参数 的 几 
何 意义 见 图 , 则 有 
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BR—s*— Hi—1 
2Ls 
加-= 7,—scosg, 
R Lssin($;—#@,) 
_ ssing, + Ls$scos($;—$,) 
,ee Li 
» _ bhoLsgcos(gs—$,)—scosg 
3 Lssin(gs —$,) 
所 以 ,通过 一 对 齿轮 传动 后 , 剑 头 的 运动 规律 ,即位 移 、 速 度 和 加 速度 分 别 为 


式 中 GG 


工 一 方 (一) 工 一 六 二 T=rs -0 
然后 ,根据 整 机 结构 实际 情况 ,确定 引 纬 机 构 的 设计 向 量 
X=[m Wm zm me rs mm Toh=H Hs Le il I: Ls Hi Hl 
其 中 ,各 个 参数 对 应 有 一 定 的 结构 所 允许 的 上 下 界 变 化 范围 , 即 边界 约束 条 件 xz! 二 zx; 二 x?。 
又 考虑 到 在 引 纬 规律 中 , 剑 头 进 、 出 梭 口 时 空 动 
程 和 时 间 、 总 动 程 和 剑 头 进 足 交接 纬 时 间 、 最 大 加 速 
度 等 是 最 重要 的 。 除 最 大 加 速度 影响 动力 学 性 能 需 
要 控制 外 ,其 他 是 由 织造 工艺 要 求 确定 的 ,如 图 7-5 xi 
所 示 。 其 中 :$、Zi ,pp、z。 和 $x 分 别 为 织造 工艺 0° bi $m $o 360° $ 
要 求 的 剑 头 进 、 出 梭 口 和 最 大 动 程 时 的 时 间 角 ,位 
移 ;wa 分 别 为 箱 幅 和 交接 纬 冲程 的 一 半 。 通 常 要 
求 进 、 出 梭 口 时 间 角 内 二 75"、#. 二 285°, 设 对 应 实际 位 移 xz、x. ,最 大 动 程 zw 时 的 时 间 角 加 E 
(175 ,190 ) ,那么 考虑 一 定 的 允许 变化 范围 5, 建立 织造 工艺 要 求 对 引 纬 机 构 的 约束 条 件 : 
Ti 


图 7-5 引 纬 工艺 要 求 


二 
wa— < vm Os 
175 二 加 < 玫 190” 
在 满足 上 述 工艺 要 求 的 前 提 下 , 尽 可 能 降低 剑 头 的 最 大 加 速度 x。 ,以 减缓 引 纬 机 构 的 受 
力 ,减少 整 机 的 振动 。 因 此 ,引出 优化 目标 函数 
F(X)= |zmx| min 
这 样 的 目标 函数 比 常见 的 取 引 纬 曲线 误差 建立 目标 函数 要 简练 得 多 , 且 可 以 提高 优化 计算 
效率 。 
此 外 ,从 机 构 学 的 角度 考虑 ,约束 条 件 中 还 应 包括 机 构 存 在 的 条 件 , 即 对 于 曲柄 任意 转角 
$， 前 面 有 关 式 中 的 根 号 内 的 值 必须 大 于 零 , 以 及 机 构 的 许 用 传动 角 条 件 。 
将 上 述 最 小 化 目标 函数 式 变换 为 最 大 化 目标 函数 ,并 通过 加 法 机 制 进行 调整 ,将 目标 函数 
值 转换 为 适 值 : 
F,(X)=—F(X)+C—>max 
式 中 :C 为 一 正常 数 (计算 时 取 1000) ,以 便 保 证 遗传 算法 搜索 过 程 中 目标 函数 值 始终 大 于 零 。 
在 遗传 操作 时 采用 精华 模型 ,保证 经 选择 交叉 和 变异 后 的 最 好 染色 体能 进入 下 代 。 优 化 
时 群体 规模 取 Po 一 40, 最 大 进化 代数 T 二 100, 杂 交 率 p. 二 0. 8, 变 异 率 加 一 0.15。 搜 索 结 果 


» 130 。 机 械 优 化 设计 








全 局 最 优点 为 X" 二 [88.0 160.0 99.0 174.0 145.0 156.5 108.0 258.0]'。 

进化 搜索 的 跟踪 过 程 如 图 7-6 所 示 , 曲线 (a) 表 示 每 一 代 最 好 适 值 随 进化 代数 的 变化 情 
况 , 曲 线 (b) 表 示 群 体 的 平均 适 值 随 进化 代数 的 变化 情况 。 由 图 可 见 , 搜 索 之 初 前 十 几 代 , 群 
体 不 满足 约束 条 件 , 经 过 若干 代 后 搜索 进入 可 行 域内 进行 ,图 中 显示 当 实 际 进化 到 约 第 45 代 
时 已 经 收敛 。 


(a) 


(b) 










optimal solution: 
x[1]=87.975 
x[2]=160.039 
x[3]=98.879 
x[4]=174.170 
x[5]=145.119 
x[6]=156.450 
x[7]=108.017 
x[8]=258.078 

best fitness=199.508 





上 


20 40 60 80 100 
图 7-6 遗传 算法 收敛 过 程 


根据 优化 结果 方案 生成 的 机 构 , 其 引 纬 规律 见 图 7-7, 剑 头 进 、 出 梭 口 时 的 位 移 分 别 为 
314. 3 mm 和 314. 8 mm, 剑 头 最 大 动 程 为 1440.4 mm, 此 时 主轴 转角 190?, 完 全 符合 引 纬 工艺 要 求 。 





7-7 优化 设计 的 引 纬 规律 


7.2 BP 神经 网 络 算法 


7.2.1 人 工 神经 元 


人 工 神 经 元 是 生物 神经 元 的 模拟 与 抽象 。 在 此 所 说 的 抽象 是 从 数学 角度 而 言 的 ,而 模拟 
是 对 神经 元 的 结构 和 功能 而 言 的 。 人 工 神经 元 相当 于 一 个 多 输入 . 单 输 出 的 非 线性 辣 值 器 件 。 
令 Tl»T29" "Tn 表示 它 的 n 个 输入 ;Wi Wo W, 表示 与 它 相 连 的 n 个 突 触 的 连接 强度 ,其 
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值 称 为 权 值 ; > )W,z, 称 为 激活 值 ,表示 这 个 神经 元 的 输入 总 和 ,对 应 于 生物 神经 细胞 的 膜 电 


位 ;O 表示 这 个 神经 元 的 输出 ;9 表示 这 个 神经 元 的 国 值 。 当 所 有 输入 信号 的 加 权 和 超过 0 时， 
人 工 神 经 元 被 激活 。 则 该 人 工 神经 元 的 输入 /输出 可 描述 为 

O= f(D Wizri—0) 
式 中 ,f(，) 表 示 神 经 元 输入 与 输出 之 间 的 非 线 性 关系 , 称 为 激活 函数 或 输出 函数 。 人 工 神 经 
元 的 输入 经 过 激活 函数 处 理 后 ,才能 得 到 其 输出 值 。 

用 WW 表示 权 向 量 ,W==[W Ws 补 W,. |]; Xl 
和 表示 输入 向 量 ,X=[Lz zz … zx]", 则 简化 
的 神经 元 如 图 7-8 所 示 ( 图 中 未 示 出 国 值 0) 。 

在 图 7-8 中 , f (net) 为 激活 函数 ,其 中 net 王 
WT'X 是 连接 权 与 此 人 工 神经 元 输入 的 向 量 积 ( 标 
量 )。 目 前 广 为 采 用 的 BP 神经 元 激活 函数 是 Sig- 
moid 函数 ,简称 S 型 函数 ,描述 为 图 7-8 人 工 神经 元 模型 


fl(net)= 


X2 





Xn 


1 
I 二 em (p>0) 《7=12) 


S 型 函数 具有 良好 的 特性 :(1) 当 输 入 信号 net 较 小 时 ,也 有 一 定 的 f 值 相对 应 , 即 输入 到 
神经 元 的 信号 比较 弱 时 ,神经 元 也 有 输出 ,避免 丢失 较 弱 信号 ;(2) 当 输入 信和 号 net 较 大 时 , 输 
出 趋 于 常数 ,不 会 出 现 “ 溢 出 ”现象 ;(3) 具 有 良好 的 微分 特性 


=f(net)[1— f(net)] (7=139 


根据 前 述 , 人 工 神经 元 具有 如 下 特点 : 

(1) 人 工 神 经 元 是 一 个 多 输入 / 单 输出 元 件 ; 

(2) 具有 非 线性 的 输入 /输出 特性 ; 

(3) 具有 良好 的 可 塑性 ,可 塑性 主要 表现 在 权 值 的 改变 ; 
(4) 人 工 神经 元 的 输出 是 全 部 输入 综合 作用 的 结果 。 


7.2.2 BP 神经 网 络 模型 


BP 神经 网 络 包括 输入 层 . 隐 含 层 及 输出 层 , 隐 含 层 可 以 多 层 或 一 层 ,每 层 的 神经 元 称 为 节 
点 。 图 7-9 为 一 具有 三 层 的 BP 神经 网 络 拓扑 结构 。 网 络 中 的 每 个 节点 都 包含 一 个 非 线性 激 
活 函 数 。 网 络 是 全 连接 的 , 即 在 任意 层 上 的 一 个 节点 与 前 一 层 上 的 所 有 节点 都 是 相连 的 。 输 
入 信号 经 过 逐 层 传播 ,到 达 网 络 输出 层 的 末端 即 成 为 一 个 输出 信和 号 

在 这 里 ,输入 向 量 表示 为 于 =[zr zx zx … Xx "… zx,j", 隐 含 层 输出 向 量 表示 为 
Y==[yo yi yy yn ;输出 层 向 量 表示 为 0 二 [oo0。 … oo … 0o01]'; 期 
望 输出 d 二 [d ，d，。 … dd: *… 4d,]'。 输 入 层 与 隐 含 层 之 间 的 权 值 矩阵 用 VV 表示 ,VW = 
[VV … VV“… Vj,; 其 中 列 向 量 V) 为 隐 含 层 第 ) 个 节点 对 应 的 权 向 量 ,V, = 
Li vw] ; 隐 含 层 到 输出 层 之 间 的 权 值 矩阵 用 W 表示 ,;W=[Wi Ws … WW …: 

Wj ,其 中 列 向 量 Wi 为 输出 层 第 个 节点 对 应 的 权 向 量 ,Wi 二 [wo wr … ” wm] '。 其 中 
Zo 与 yo 分 别 为 考虑 到 隐 含 层 与 输出 层 节点 的 阔 值 而 设置 ,如 果 隐 含 层 节点 了 的 阔 值 为 0 ,用 
zi 一 1 的 固定 偏 置 输入 节点 表示 赣 值 节点 , 则 它 与 节点 工 之 间 的 连接 权 值 为 wu 二 一 和 ;对 于 输 
出 层 节点 & 的 情况 同 理 。 
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输入 信号 
(刺激 ) 


输出 信号 
(响应 ) 





输入 层 隐 含 层 输出 层 
图 7-9 BP 神经 网 络 拓扑 结构 


7.2.3 ”BP 神经 网 络 算法 


1. BP 神经 网 络 信号 正 向 传播 

BP 神经 网 络 训练 学 习 的 第 一 阶段 为 信号 的 正 向 传播 ,输入 信号 从 输入 层 传人 ,经 各 隐 含 
层 处 理 后 , 传 至 输出 层 。 如 图 7-9 所 示 的 三 层 神经 网 络 中 各 层 信和 号 之 间 的 数学 关系 如 下 。 

对 于 输出 层 , 有 : 


0 一 net) (k=1,2,°,L) (7-14) 
netk = a (k= 1,2,"°,/) C7=15) 
对 于 隐 合 层 ,有 二 
y=f(net;) Y=1,2,°,m) (7-16) 
net; 一 a (j= 1;2,° ,m) (7-17) 


0 


式 (7-14) 一 式 (7-17) 与 式 (7-12) 共 同 构成 BP 神经 网 络 的 数学 模型 。 

2. BP 神经 网 络 误差 反 向 传播 

BP 神经 网 络 训练 学 习 的 第 二 阶段 为 误差 的 反 向 传播 。 当 输出 误差 (输出 层 实际 输出 与 期 
望 输出 之 差 ) 不 满足 精度 要 求 时 , 则 进入 网 络 误差 的 反 向 传播 阶段 。 误 差 反 传 是 将 输出 误差 以 
某 种 方式 通过 隐 含 层 向 输入 层 逐 层 反 传 ,将 误差 分 摊 给 各 层 的 所 有 节点 ,从 而 获得 各 层 节点 的 
误差 信号 ,并 且 根 据 此 误差 信号 修正 各 节点 的 连接 权 值 。 

下 面 以 常用 的 三 层 BP 神经 网 络 为 例 介绍 其 算法 。 

(1) 误差 反 向 传播 算法 。 

当 网 络 输出 与 期 望 输出 不 相等 时 , 则 存在 输出 误差 玉 , 定 义 为 


1 :1~ ， 
E=zld-ol’= 3d 0) (7-18) 
将 以 上 误差 定义 展开 至 隐 含 层 , 有 
1 ~ 于 .县 出 
六 pL 一 Cnet) 了 一 pL 一 人 (Zoo (7-19) 


进一步 展开 至 输入 层 , 有 


一 二 {di /Zonf nes) ])} = 凶 这 {di -fmf (20%71)]} 
由 上 式 看 出 ,网 络 误差 是 相 邻 层 之 间 权 值 wj vi 的 函数 ,因此 调整 权 值 可 改变 误差 EE。 从 
函数 优化 角度 看 ,误差 函数 王 也 称 为 目标 函数 或 代价 函数 。 
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为 使 网 络 误差 不 断 地 减 小 ,调整 权 值 的 一 种 思路 是 取 误 差 的 负 梯 度 方向 作为 权 值 的 调 
整 方向 , 即 
aFE 





Awix 二 一 7 (7 一 0,1,2 2723 一] 2 (7-20(a)) 
5 
Am= 一 ?至 (i=0,1,2,° ,nn;j=1,2,* ,7m) (7-20(b)) 


其 中 , 负 号 表示 梯度 的 反方 向 ,比例 常数 7 称 为 学 习 率 ,7E (0,1) ,在 网 络 训练 中 反映 其 学 
习 效 率 。 

信号 正 向 传播 与 误差 反 向 传播 的 各 层 权 值 调整 过 程 是 周而复始 地 进行 的 。 权 值 不 断 调整 
的 过 程 ,就 是 网 络 的 学 习 训 练 过 程 。 此 过 程 一 直 进 行 到 网 络 输出 误差 减少 到 可 接受 的 程度 ,或 
者 进行 到 预先 设 定 的 学 习 次 数 为 止 。 

(2) 误差 反 向 传播 算法 推导 。 

式 (7-20) 仅 是 权 值 调整 思路 的 数学 表达 ,而 不 是 具体 的 权 值 调整 计算 式 。 下 面 推 导 三 层 
BP 网 络 算法 权 值 调整 的 计算 式 。 

对 于 输出 层 , 式 (7-20(a) ) 可 写 为 


es 2 二 aE onet' 由 
Awi: 一 730 ? het Bo (7-21(a)) 


对 于 隐 含 层 , 式 (7-20(b) ) 可 写 为 








aE _ aE Anet; 




















Am 一 一 ?3 一 net av, (7-21(b)) 
对 输出 层 和 隐 含 层 各 定义 一 个 误差 信和 号 
加 
B= et (7-22(a)) 
站 (7-22(b)) 
onet; 
综合 应 用 式 (7-15) 与 式 (7-22(a)), 可 将 式 (7-21(a)) 的 权 值 调整 改写 为 
Awi = WOkYj (7-23(a)) 
综合 应 用 式 (7-17) 与 式 (7-22(b)), 可 将 式 (7-21(b)) 的 权 值 调整 改写 为 
一 ;rr， (7-23(b)) 
为 了 具体 表达 式 (7-23) 的 权 值 调整 量 , 下 面 求 避 和 6}。 
对 于 输出 层 ,6? 可 展开 为 
i BE .a0 .80E 7 Bl 
= 了 et 和 ER (net,) (7-24(a)) 
对 于 隐 含 层 ,9/ 可 展开 为 
mE 9E dy 9k i 
全 守 het, Dy Onet. By (net;) (7-24(b)) 
下 面 求 式 (7-24) 中 网 络 误差 对 各 层 输 出 的 偏 导 数 。 
对 于 输出 层 ,利用 式 (7-18) ,可 得 
2 (qd,—or) (7-25(a)) 
Ok 


对 于 隐 含 层 , 利 用 式 (7-19) ,可 得 
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BE._ 
二 
将 以 上 结果 代 人 式 (7-24(a) ) 与 式 (7-24(b)) ,并 利用 式 (7-13) ,可 分 别 得 到 输出 层 与 隐 
含 层 的 误差 信和 号 


人 
— Ddi — of (neti)wn (7-25(b)) 
k=1 


=(d,—o,)o.(l1—o:) (7-26(a)) 


i 1 
} 一 [Za —o)f (net wn |f’ (neti) 一 (之 /8 )ytl—y) (7:26(b)) 
k=1 k=1 


将 式 (7-26) 代 入 式 (7-23) ,可 得 三 层 BP 神经 网 络 学 习 算 法 权 值 调整 的 计算 公式 


2 py (7-27(a)) 


Ud 
[Avs = WB}z; = 1( Down )yj (1— y;) x (7-27(b)) 
k=1 


由 上 式 可 知 ,对 于 BP 学 习 算 法 ,各 层 权 值 调整 计算 式 在 形式 上 是 一 样 的 , 均 由 学 习 率 本 
层 输 出 的 误差 信号 及 本 层 输 入 信号 构成 。 其 中 输出 层 误差 信号 和 网 络 的 期 望 输 出 与 实际 输出 
之 差 有 关 , 是 从 输出 层 开始 逐 层 反 向 传播 的 。 

3，BP 神经 网 络 算法 步骤 

前 面 介 绍 的 算法 称 为 标准 BP 算法 。 其 编程 步骤 如 下 : 

(1) 初始 化 ”对 所 有 连接 权 和 矩阵 WV 赋 随 机 任意 值 ,将 样本 计数 器 p 和 训练 次 数 计数 器 g 
置 为 1, 误差 为 0, 学 习 率 jy 设 为 区 间 (0,1] 内 较 小 的 数 , 网 络 训练 精度 Ei, 设 为 一 小 的 正 数 。 

(2) 输入 训练 样本 对 ,计算 各 层 输出 ”用 当前 样本 X* 、d* 对 向 量 数组 XX、d 赋值 ,根据 式 
(7-16) 和 式 (7-14) 计 算 隐 含 层 、 输 出 层 的 输出 Y 与 0 的 分 量 。 

(3) 计算 网 络 输出 误差 设 共 有 pp 对 训练 样本 ,对 应 于 每 一 个 样本 的 网 络 误差 E* = 


P FB 
| > (dt 一 of)*; 网 络 的 总 误差 Ew 一 | 语 了 (E?)?。 
k=] p=1 


(4) 计算 各 层 误差 信号 ”应 用 式 (7-26(a)) 和 式 (7-26(b)) 计 算 8 和 07。 

(5) 调整 各 层 权 值 ” 应 用 式 (7-27(a)) 和 式 (7-27(b)) 计 算 权 值 向 量 W.V 的 各 分 量 。 

(6) 检查 是 否 已 完成 对 所 有 样本 完成 一 次 轮训 若 p 二 P, 则 p<p 十 1,q<-q 十 1, 返 回 步 
又 (2) ,否则 执行 步骤 (7)。 

(7) 检查 网 络 总 误差 是 否 达 到 精度 要 求 ” 着 Em 三 Ei, 则 训练 结束 ;否则 E<-0,p<-0, 返 
回 步骤 (2)。 

标准 BP 算法 框图 如 图 7-10 所 示 。 

在 实际 应 用 中 , 权 值 调整 方法 有 两 种 。 一 种 就 是 上 述 标准 BP 算法 所 采用 的 权 值 调整 方 
法 , 即 每 输入 一 个 样本 ,都 需要 误差 反 向 传播 并 调整 权 值 ,这 种 方法 称 为 单 样本 训练 。 此 方法 
存在 训练 次 数 增加 ,收敛 速度 慢 的 缺点 。 另 一 种 方法 是 在 所 有 样本 输入 之 后 ,计算 网 络 的 总 误 
差 , 然 后 根据 总 误差 计算 各 层 的 误差 信号 并 调整 权 值 ,这 种 累积 误差 的 批 处 理 方式 称 为 批 训练 。 
批 训练 可 以 保证 总 误差 趋 于 减 小 ,尤其 在 样本 较 多 时 , 批 训练 比 单 样本 训练 的 收敛 速度 快 。 


7.2.4 ”BP 神经 网 络 的 设计 要 点 


1. 训练 样本 数 的 确定 
BP 网 络 的 能 力 与 网 络 信息 容量 有 关 。 而 网 络 信 息 容量 可 用 网 络 的 权 值 和 阅 值 总 数 来 
表征 , 则 训练 样本 数 P 与 给 定 的 训练 误差 s 间 应 满足 以 下 匹配 关系 : 
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初始 化 所 
计数 器 p=1,g=1 


输入 样本 ， 计 算出 各 层 数 : 
y=/(VIX) j=1,2,",m 
Oi:=f(WIY) k=1,2,…,1 




















计算 输出 误差 : 


Er= | > (df -of 


计算 各 层 误差 信号 : 
中 =(di-obot1-ob 大 =1 和 二 三 


U 
07 = (Bo ] j=1 52 ,°° ,0 
k= 










调整 各 层 权 值 : 






Wa= Wet TO Ky) 


d= 
Vy= Vyt 07 x ! 





图 7-10 标准 BP 算法 框图 


Pa 
€ 


上 式 表明 ,网 络 信息 容量 与 训练 样本 之 间 存 在 合理 的 匹配 关系 。 但 实际 问题 的 样本 数 常 
常 难 以 满足 以 上 要 求 。 对 于 确定 的 样本 数 , 网 络 参数 太 少 则 不 足以 表达 样本 中 蕴涵 的 全 部 规 
律 ,而 网 络 参数 太 多 则 由 于 样本 信息 少 而 得 不 到 充分 训练 。 所 以 , 当 实 际 问题 的 训练 样本 较 少 
时 ,必须 设法 减少 7。 根据 经 验 ,训练 样本 数 是 网 络 连接 权 总 数 的 5~~10 倍 。 

2. 训练 样本 数 的 选择 与 组 织 

网 络 训练 中 提取 的 规律 蕴涵 在 样本 中 ,因此 样本 必须 具有 代表 性 。 样 本 的 选择 要 注意 样 
本 类 别 的 均衡 ,尽量 使 每 个 类 别 的 样本 数量 大 致 相等 。 即 使 是 同一 样本 也 要 兼顾 样本 的 多 样 
性 与 均匀 性 。 同 时 ,样本 的 组 织 要 注意 将 不 同类 别 的 样本 交叉 输入 ,或 从 训练 集中 随机 选择 输 
人 样本 ,以 正确 建立 样本 蕴涵 的 映射 关系 和 减少 训练 时 间 。 

3. 突 触 权 值 的 初始 化 

网 络 权 值 的 初始 化 决定 了 网 络 的 训练 在 误差 曲面 起 始 位 置 ,从 而 影响 收敛 速度 ,并 关系 到 
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能 否 求 得 全 局 极 小 点 ,因此 初始 化 方法 对 缩短 网 络 的 训练 时 间 至 关 重 要 。 权 值 初始 化 方法 有 
两 种 :一 种 方法 是 ,初始 权 值 设 置 成 足够 小 ; 另 一 种 方法 是 ,初始 值 为 一 1 和 十 1 的 权 值 数 相等 。 
在 实际 应 用 时 ,对 隐 含 层 权 值 采 用 第 一 种 方法 ,而 对 输出 层 采 用 第 二 种 方法 。 按 上 述 方法 设置 
的 初始 权 值 可 使 每 个 节点 一 开始 都 工作 在 其 激活 函数 变化 最 敏感 的 区 域 ,从 而 使 网 络 的 学 习 
速度 较 快 。 

4. 隐 含 层 数 的 确定 

理论 分 析 证 明 , 具 有 一 个 隐 含 层 的 BP 神经 网 络 可 以 映射 所 有 连续 函数 ,只 有 当 出 现 不 连 
续 函数 时 , 才 需 要 两 个 隐 含 层 , 所 以 BP 神经 网 络 最 多 只 需 两 个 隐 含 层 。 在 设计 BP 神经 网 络 
时 一 般 先 考虑 设置 一 个 隐 含 层 , 当 一 个 隐 含 层 的 隐 节 点 数 很 多 却 仍 不 能 改善 网 络 性 能 时 , 才 考 
虑 再 增加 一 个 隐 含 层 。 由 经 验 表 明 , 采 用 两 个 隐 含 层 时 ,如 果 第 一 个 隐 含 层 隐 节点 较 多 而 第 二 
个 隐 含 层 隐 节点 较 少 , 则 有 利于 改善 BP 神经 网 络 的 性 能 。 此 外 ,对 于 有 些 实际 问题 ,采用 两 
个 隐 含 层 所 需 的 隐 节 点 总 数 可 能 少 于 单 隐 含 层 所 需 的 隐 节 点 数 。 

5. 隐 节 点 数 的 确定 

隐 节 点 的 作用 是 从 样本 中 提取 并 存储 其 内 在 规律 ,每 个 隐 和 节点 的 权 值 都 是 增强 网 络 映射 
能 力 的 一 个 参数 。 如 果 隐 节点 数 太 少 , 网 络 从 样本 中 获取 信息 的 能 力 就 差 , 不 足以 概括 和 体现 
训练 集中 的 样本 规律 。 然 而 , 当 隐 节点 数 过 多 时 ,有 可 能 把 样本 中 非 规律 性 的 内 容 ( 如 噪声 ) 也 
学 会 记 牢 ,出现 所 谓 * 过 吻合 ”问题 ,从 而 降低 神经 网 络 泛 化 能 力 。 此 外 , 隐 节 点 数 太 多 会 导致 
训练 时 间 增 加 。 

合理 的 隐 节 点 数量 取决 于 训练 样本 数 的 多 少 ,样本 噪声 的 大 小 以 及 样本 中 蕴涵 规律 的 复 
杂 程 度 。 一 般 来 说 ,波动 次 数 多 、 震 荡 幅 度 大 的 复杂 非 线 性 函数 要 求 网 络 具有 较 多 的 隐 节 点 来 
增强 其 映射 能 力 。 

通常 , 隐 含 层 的 节点 数 通过 试 凑 法 确定 。 可 先 设 置 较 少 的 隐 节 点 训练 网 络 ,然后 逐渐 增加 
隐 节 点 数 , 用 同一 样本 集训 练 , 从 而 确定 网 络 误 差 最 小 时 对 应 的 隐 节 点 数 。 在 用 试 次 法 时 ,可 
利用 下 列 经 验 公 式 估 算 隐 节点 数 的 初始 值 。 

m= 二 Vn 十 [十 a 
m=logn 
式 中 :m 为 隐 含 层 节 点 数 ;n 为 输入 层 节点 数 ;/ 为 输出 节点 数 ;a 为 1 一 10 之 间 的 常数 。 

6. 网 络 训 练 与 测试 

在 确定 BP 神经 网 络 结构 以 后 , 需 用 样本 对 网 络 进行 训练 。 训 练 时 对 所 有 样本 正 向 传播 
计算 一 轮 并 反 向 修改 权 值 一 次 称 为 一 次 训练 。 通 常 训 练 一 个 网 络 需要 成 千 上 万 次 。 在 训练 过 
程 中 要 反复 使 用 样本 集 数据 ,但 每 一 轮 最 好 不 要 按 固定 的 顺序 取 数 据 。 

评价 网 络 性 能 好 坏 的 主要 标准 是 其 泛 化 能 力 ,而 对 泛 化 能 力 的 测试 不 能 用 训练 集 的 数据 
进行 ,而 要 用 训练 集 以 外 的 测试 数据 来 进行 检验 。 一 般 的 做 法 是 ,将 收集 到 的 可 用 样本 随机 地 
分 成 两 部 分 :一 部 分 作为 训练 集 , 另 一 部 分 作为 测试 集 。 如 果 网 络 对 训练 样本 集 的 误差 很 小 ， 
而 对 测试 样本 集 的 误差 很 大 ,说 明 网 络 训练 已 “过 吻合 ”, 因 此 泛 化 能 力 差 。 

在 隐 节 点 数 一 定 的 情况 下 ,为 获得 良好 的 泛 化 能 力 ,存在 着 一 个 最 佳 训练 次 数 。 训 练 时 将 
训练 与 测试 交替 进行 ,每 训练 一 次 记录 一 个 训练 均 方 误差 ,然后 保持 网 络 权 值 不 变 ; 用 测试 数 
据 正 向 运行 网 络 ,记录 测试 均 方 误差 。 如 果 在 某 一 训练 次 数 to 之 前 , 随 着 训练 次 数 的 增加 ,两 
种 均 方 误差 同时 下 降 , 而 当 超 过 这 个 训练 次 数 时 ,训练 误差 继续 减 小 而 测试 误差 则 开始 上 升 ， 
于 是 该 训练 次 数 to 即 为 最 佳 训 练 次 数 。 训 练 次 数 小 于 to 称 为 训练 不 足 , 训 练 次 数 大 于 to 称 
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为 训练 过 度 。 
7.2.5 BP 神经 网 络 算法 的 改进 


1. BP 算法 存在 的 缺陷 

BP 神经 网 络 算法 可 以 以 任意 精度 逼近 任何 非 线性 函数 ,并 且 得 到 广泛 应 用 。 然 而 标准 
BP 算法 在 应 用 中 也 存在 不 少 缺陷 。 

(1) 学 习 算 法 的 收敛 速度 慢 。 

BP 神经 网 络 训练 次 数 过 多 将 导致 训练 过 程 过 长 ,学习 收 敛 速度 变 慢 。 

影响 BP 学 习 算 法 收敛 速度 的 主要 因素 之 一 是 学 习 率 。 如 果 学 习 率 太 小 ,网 络 的 收敛 速 
度 会 非常 慢 ; 如 果 学 习 率 太 大 ,会 使 网 络 出 现 震荡 而 无 法 收敛 。 但 目前 学 习 率 的 取 值 尚 无 理论 
指导 ,通常 凭 经验 在 0.01 一 1 之 间 取 值 。 

(2) 陷 人 局 部 极 小 点 。 

BP 神经 网 络 的 误差 函数 是 以 Sigmoid 函数 为 自 变量 的 非 线 性 函数 ,由 其 构成 的 连接 权 值 
空间 是 具有 多 个 局 部 极 小 点 的 超 曲 面 ,容易 造成 网 络 的 训练 过 程 在 遇 到 局 部 极 小 点 时 无 法 继 
续 进行 下 去 的 情况 ,而 产生 “局 部 极 小 值 ”问题 。 

影响 BP 学 习 算 法 陷 人 局 部 极 小 点 的 主要 因素 是 连接 权 值 的 初始 化 。 若 初始 连接 权 值 太 
大 , 则 可 能 在 学 习 训练 一 开始 就 使 网 络 处 于 Sigmoid 函数 的 饱和 区 ,从 而 使 网 络 陷 人 局 部 极 小 
点 。 因 此 ,初始 连接 权 值 通常 取 较 小 值 ,以 便 使 每 个 节点 的 状态 值 接近 于 零 , 以 确保 网 络 在 学 
习 开 始 时 避免 陷 和 人 局 部 极 小 点 。 

(3) 隐 含 层 层 数 及 节点 数 的 选取 缺乏 理论 指导 。 

目前 , 隐 含 层 层 数 及 节点 数 的 选取 尚 无 理论 上 的 指导 ,通常 根据 如 前 所 述 的 经 验 来 确定 。 
因此 ,网 络 往往 存在 较 大 的 元 余 , 无 形 中 也 影响 了 网 络 学 习 训 练 的 速度 。 

(4) 训练 时 学 习 新 样本 时 有 遗忘 旧 样 本 的 趋势 。 

BP 神经 网 络 的 记忆 具有 不 稳定 性 。 当 给 一 个 训练 结束 的 BP 神经 网 络 提供 新 的 记忆 模 
式 时 ,会 破坏 已 经 调整 完毕 的 网 络 连 接 权 值 ,导致 遗忘 , 即 学 习 模 式 信息 消失 。 

2. BP 算法 的 改进 

针对 标准 BP 算法 存在 的 问题 和 缺陷 ,研究 人 员 已 提出 不 少 有 效 的 改进 算法 ,下 面 介绍 两 
种 常用 的 改进 措施 。 

(1) 学 习 率 的 自 适应 调整 。 

在 标准 BP 算法 中 ,学 习 率 7 为 常数 ,根据 前 面 分 析 , 为 了 使 训练 学 习 达 到 最 佳 , 必 须 在 训 
练 过 程 中 不 断 调整 学 习 率 。 

学 习 率 的 自 适应 调整 算法 的 思路 是 ,如 果 误 差 不 断 减 小 并 趋向 其 预 设 值 时 ,说 明 误差 修正 
方向 正确 ,此 时 应 增加 学 习 率 ;如 果 误 差 不 断 增加 并 超过 其 预 设 值 时 ,说 明 误差 修正 方向 错误 ， 
此 时 应 减 小 学 习 率 , 即 

Sine (71) E(nt1)<E(n) 
en Ent+1)>E(n) 
式 中 :sme 为 学 习 率 增 量 因子 ;saee 为 学 习 率 减 量 因子 。 

(2) 增加 动量 项 。 

标准 BP 算法 在 调整 连接 权 值 时 ,只 考虑 本 次 调整 时 的 误差 梯度 下 降 方向 ,而 未 考虑 前 一 
次 调整 时 的 误差 梯度 方向 ,因而 经 常 使 训练 过 程 发 生 震 荡 ,收敛 缓慢 。 因 此 ,为 了 减 小 震荡 ,加 
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快 网 络 的 训练 速度 ,对 连接 权 值 进行 调整 时 应 引入 动量 项 , 即 按 一 定 比 例 加 上 前 一 次 学 习 时 的 
调整 量 。 若 用 多 表示 某 层 (输出 层 或 隐 含 层 ) 权 矩阵,X 表示 某 层 输入 向 量 , 则 带 有 动量 项 的 
连接 权 值 调整 量 公式 为 

AW(n)=mX+YAW(n—1) 
式 中 :7 为 学 习 率 ;8 为 某 层 的 误差 信号 ,YXYAW(" 一 1) 为 动量 项 ,其 中 并 为 学 习 次 数 ,7 为 动量 系 
数 ,0 二 y 二 1, 一 般 取 0. 9 左右 。 


7.2.6 基于 BP 神经 网 络 的 优化 设计 


基于 神经 网 络 的 优化 算法 的 基础 在 于 : 

(1) 神经 网 络 是 一 种 非 线 性 动力 系统 ,而 且 通 过 学 习 机 制 趋 于 稳定 并 收敛 于 渐 近 平衡 稳 
定点 。 
(2) 神经 网 络 的 渐 近 平衡 点 恰好 是 能 量 函 数 的 极 小 点 。 
因此 ,神经 网 络 的 求解 过 程 与 优化 设计 的 搜索 过 程 有 如 下 对 应 关系 :系统 的 能 量 函 数 与 优 
化 问题 的 目标 函数 相对 应 ;人 工 神 经 网 络 的 各 个 参数 与 优化 问题 的 各 个 设计 变量 相对 应 ;神经 
网 络 系统 的 演化 过 程 与 优化 问题 的 设计 空间 及 寻 优 过 程 相对 应 。 实 现 神 经 网 络 用 于 优化 设计 
的 关键 是 要 根据 优化 问题 的 目标 函数 构造 相应 的 人 工 神经 网 络 能 量 函 数 , 则 BP 神经 网 络 从 
初始 状态 趋 于 平衡 稳定 状态 的 过 程 即 为 从 初始 点 允 近 最 优 解 的 优化 寻 优 过 程 。 这 就 是 利用 神 
经 网 络 用 于 优化 设计 的 理论 基础 。 

对 于 无 约束 优化 问题 

minf (X) 


其 下 降 法 的 迭代 公式 为 
Xt!=X:—M, VX:) 
式 中 :Mi 为 n 阶 对 称 正定 矩阵 ;XX 为 初始 点 。 
其 求解 过 程 可 看 作 如 下 微分 方程 的 求解 
em 
dt (7-28) 
XO = 
式 中 :M(X, 四 是 n 阶 对 称 和 矩阵 。 若 XX" 是 能 量 函 数 E(X) 的 极 小 点 , 则 必 有 VxE(X* )==0, 因 此 
X "是 该 微分 方程 的 解 ,也 是 动力 系统 的 平衡 点 。 这 样 只 要 设计 一 个 动力 系统 方程 式 (7-28)， 
就 可 以 求 神经 网 络 系统 的 平衡 点 YxE(X' ) 一 0 来 代替 求解 该 无 约束 优化 问题 。 
对 于 约束 优化 问题 


s.t. gu,(X)ZO 2 一 1，2，…，77 
h,(X)=0 w=1,2,.…,p=n 
利用 外 点 罚 函数 法 ,可 以 转化 为 求 下 面 函数 的 极 小 点 


| f(X) XER” 


p m 
EE,r) = KD 去 Zr (Ch,(XI)? 十 rmax(0,g. (0))’ (7-29) 
它 可 以 用 下 面 的 动力 系统 平衡 点 代替 
dj yr) 
dt (7-30) 
(OY 
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式 中 :U 王 diagGa ,avi 盖 0 (一 1,2,…,2)。 同 样 , 若 X* 是 对 应 动力 系统 能 量 函 数 羽 
(X) 的 极 小 点 ,; 则 XX“ 就 是 上 述 约束 优化 问题 的 最 优 解 。 

BP 神经 网 络 优化 算法 步骤 如 下 : 

(1) 针对 优化 问题 构造 能 量 函 数 E(X) ,并 使 它 有 具有 和 较 好 的 稳定 性 ,如 具有 正定 二 次 型 
形式 。 

(2) 由 能 量 函 数 求解 其 动力 系统 方程 。 

(3) 用 学 习 方 法 解 出 平衡 点 , 即 VxE(X) 二 0。 

利用 BP 神经 网 络 解决 优化 设计 问题 的 作用 体现 在 两 个 方面 :一 个 是 用 于 函数 构造 的 方 
法 ; 另 一 个 是 直接 作为 优化 方法 来 使 用 。 


7.2.7 ”BP 神经 网 络 在 优化 设计 中 的 应 用 


BP 神经 网 络 的 优化 、 预 测 、 聚 类 等 功能 已 经 广泛 应 用 于 工程 .农业 、 医 学 等 领域 。 下 面 通 
过 两 个 工程 实例 来 说 明 BP 神经 网 络 在 机 械 优化 设计 中 的 应 用 。 

1. 液体 动 压 润滑 固定 轴瓦 推力 轴承 优化 设计 

对 于 液体 动 压 推力 轴承 ,良好 的 润滑 和 承载 能 力 需要 合理 的 轴瓦 结构 来 保证 。 如 图 7-11 
所 示 为 固定 轴瓦 推力 轴承 ,其 轴瓦 沿 圆周 方向 被 分 隔 成 具有 一 定 斜 度 的 若干 固定 瓦 块 , 并 与 基 
体 构成 一 个 整体 。 下 面 利 用 BP 神经 网 络 算法 对 其 结构 进行 优化 。 





图 7-11 固定 轴瓦 推力 轴承 图 7-12 固定 瓦 块 推力 轴承 的 
几何 尺寸 及 受 力 分 布 
(1) 建立 优化 数学 模型 。 
固定 瓦 块 推力 轴承 的 结构 尺寸 如 图 7-12 所 示 。 影 响 轴承 的 参数 包括 : 轴承 内 径 Di (m)、 
轴承 外 径 D;(m) ,轴承 宽度 BC(m) .轴瓦 块 数 z、 轴 瓦 出 口 油膜 厚度 hh(m) .轴瓦 人 口 油 膜 厚度 
h;(m) ,油膜 厚度 比 5、 润滑 油 动 力 黏度 w(Pa，s)、 轴 承 转速 n(r/min)、 轴 瓦 承载 面 长 度 
Lo(m) \ 承 载 瓦 块 在 以 轴承 平均 直径 Du 为 直径 的 圆周 上 的 弧 线 长 度 Le 和 Lo。 在 工作 载荷 和 
转速 一 定 的 情况 下 ,为 提高 轴承 的 承载 能 力 和 使 用 性 能 ,确定 优化 设计 变量 为 X= (zi ,zz ,zs， 
dy rres se) = BsLo hi, hes,n Ds)T 
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以 液体 动 压 润滑 固定 轴瓦 推力 轴承 具有 最 大 承载 能 力 为 设计 目标 ,建立 目标 函数 
和 (6 一 21) 总 Lors 
f(X)= f(x ,Xs ya Ts TO OF 
式 中 :F 为 轴承 所 受 载荷 CN) 。 

根据 轴承 几何 尺寸 .轴承 的 平均 压强 .pp 值 、 油 膜 厚度 比 ` 温度 限制 .动力 黏度 的 要 求 建 立 
相应 的 约束 函数 如 下 


gl1(CX) 一 2zl 十 dd 十 0.002 一 zi 委 0 
-Eeeyni 
B2(X) = Lp]<0 


Fn 


A 





—[Lpvj<0 
gi(X)=1.8—<0 
T3 


g;(X) = 于 —3<0 

gs( 关 ) 二 30 十 At 一 100 志 0 

g7(X) 一 in 一 Z5 福 0 
式 中 :d 为 轴 颈 直径 ;zx 为 轴瓦 块 数 ;Lp] 为 瓦 面 许 用 平均 压强 ;Lpvj] 为 瓦 面 许 用 pv 值 ;wi 为 最 
小 许 用 黏度 ;At 为 轴承 的 润滑 油 温 升 ,有 


2 -人 
= TT nz 25 , NTT 
{1.95+0.83|1 0.6( 对 | TF 2 








At 一 





2 2 
7nz” Xi x2 Ta 机 TQ0T6 


co ”450 4 








2 
40.45{1.95+0. 83[1-0.6( 开 一 1) | } zs/z1) 
Tz? TT3 


其 中 :cv 为 润滑 油 比热容 ,w 为 润滑 油 密 度 ,as 为 轴承 的 表面 传 热 系数 。 

(2) 建立 能 量 函 数 。 

根据 式 (7-29) 构 建 由 上 述 目标 函数 ,不等式 约束 函数 组 成 的 泛 函 即 该 约束 优化 问题 的 能 
量 函 数 。 然 后 利用 BP 神经 网 络 求解 。 

(3) 算 例 。 

已 知 条 件 : 某 汽轮机 瓦 块 推力 轴承 Ff=20 kN,n 二 1200 r/min,d 二 50 mm,z 二 6,[p] 二 2.5 
MPa,Lpvl=85 MPa。m/s,o 一 900 kg/m’ ,nuin—=0.016 Pa® sw 一 50 W/(m’ * °C),c,=2000 
J/(kg* 'C), 

输入 层 的 初始 值 为 二 (0.01,0.01,0.000005,0.000005,0.01,0.1)7, 经 BP 神经 网 络 编 
程 计算 ,其 最 优 解 X' 二 (0.0209093,0.0637673,0.0055518,0. 0099932 ,0. 016,0. 1)7 ,最 优 值 
了 (X* ) 二 0.0000216。 实 践 表 明 , 基 于 神经 网 络 的 优化 设计 方法 具有 和 较 好 的 稳定 性 和 足够 的 
精度 ,在 解决 液体 动 压 润滑 固定 轴瓦 推力 轴承 优化 问题 时 是 有 效 的 。 

2. 基于 BP 神经 网 络 的 汽车 侧 磁 多 目标 优化 设计 

神经 网 络 除 上 例 直 接 用 于 优化 方法 外 ,通常 还 用 于 优化 中 代替 某 种 大 运算 (如 有 限 元 ) ,或 
规律 性 数据 处 理 的 拟 合 。 本 例 就 是 其 一 种 典型 的 应 用 。 

在 汽车 轻 量化 过 程 中 必须 考虑 其 耐 撞 性 与 安全 性 ,故此 优化 问题 是 多 目标 优化 问题 。 无 
论 单 次 碰撞 还 是 一 次 整 车 侧面 碰撞 仿真 ,有 限 元 仿真 计算 都 十 分 耗 时 ,同时 优化 是 一 个 反复 迭 
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代 的 过 程 ,而 一 次 优化 迭代 过 程 至 少 需要 调用 上 千 次 
有 限 元 模型 计算 结果 ,使 得 优化 设计 失去 实际 意义 。 
如 果 利 用 BP 神经 网 络 来 求解 此 多 目标 优化 问题 则 可 
以 克服 这 些 缺 点 ,并 且 能 以 较 高 的 精度 逼近 实际 碰撞 
过 程 。 下 面 分 析 基 于 BP 神经 网 络 的 侧 碰 多 目标 优化 
设计 方法 。 

(1) 侧 磁 BP 神经 网 络 近似 模型 的 建立 。 

根据 车 型 和 工程 经 验 ,选取 对 侧 碰 影响 最 显著 的 6 
个 零件 作为 设计 对 象 ,如 图 7-13 所 示 。 其 8 个 设计 变量 





如 表 7-2 所 示 , 其 中 前 6 个 设计 变量 (i 二 1,2,…,6) 图 7-13 设计 对 象 示意 图 
为 1 一 6 号 零件 的 板 厚 ,属于 连续 变量 , 分布 范 围 从 1 一 前 地 板 横梁 ;2 一 门槛 加 强 板 ， 
0. 5tw 到 1. 5tw ;其 中 to(i 二 1,2,…,6) 为 对 应 零件 的 基 $B 柱 加 强 板 ,4 一 后 地 板 横 条， 


准 板 厚 ;后 2 个 设计 变量 mi .ms 分 别 为 2 号 零件 与 3 


号 零件 的 材料 牌号 ,属于 离散 变量 ,可 选 普通 钢 (MS) 或 高 强度 钢 (HSS)。 
表 7-2 设计 变量 定义 





3 B 柱 加 强 板 板 厚 0 5tw Hl. tw 
后 地 板 机 梁 板 厚 随机 变量 0. Stw < <1. Bt 


利用 拉丁 方 试验 设计 方法 生成 100 个 有 限 元 模型 样本 ,经 有 限 元 计算 得 到 全 部 样本 的 仿 
真 结果 。 另 外 ,在 Matlab 软件 中 ,利用 上 述 100 个 样本 点 的 计算 结果 构建 质量 m 与 假 人 响应 
中 肋骨 变形 量 了 .中 肋骨 黏 性 指数 VC、 腹 部 力 已 .骨盆 力 F, 的 BP 神经 网 络 近似 模型 。 其 中 
m 为 6 个 零件 的 总 质量 ,初始 值 为 10. 177 kg。 

利用 海 默 斯 利 试验 设计 方法 在 设计 空间 均匀 选取 10 个 样本 点 ,结果 表明 BP 神经 网 络 近 
似 模 型 的 精度 满足 工程 要 求 , 可 以 取代 有 限 元 模型 进行 工程 优化 设计 。 

(2) 多 目标 优化 过 程 及 优化 结果 。 

此 问题 的 优化 目标 是 侧 围 结构 轻 量 化 及 保证 安全 性 。 对 于 整 车 侧 围 结 构 安 全 设计 , 主要 
的 设计 目标 是 降低 碰撞 过 程 中 的 各 假 人 损伤 值 (D、VC、F, 与 FE;), 从 而 达到 保护 乘员 安全 的 
目的 。 为 了 简化 这 一 多 目标 问题 ,将 通过 正则 的 加 权 和 作为 各 假 人 损伤 值 的 综合 评估 函数 简 
化 , 即 | 

WIC=0. 3( 及 + 守 )+o. 2 (六 + 芋 ) 

WIC 值 越 小 ,说 明 对 侧 碰 乘员 的 保护 性 越 好 。 将 由 有 限 元 计算 得 到 的 各 假 人 响应 值 (D=33. 3 
mm,VC=0.579 m/s,2.65 kN,3.43 kN) 代 入 上 式 计 算得 到 WIC 初始 值 为 0. 738。 
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根据 前 面 分 析 ,建立 车 辆 侧 碰 多 目标 优化 问题 的 数学 模型 如 下 : 
min m 
min WIC 
s. t. DZ<42 mm 
VC<1 m/s 
F,<2.5 kN 
F,<6 kN 
此 车 辆 侧 碰 多 目标 问题 的 优化 计算 流程 如 图 7-14 所 示 。 
通过 软件 Isight 调用 Matlab 工具 箱 ,利用 多 目标 遗传 算法 对 BP 神经 网 络 近 似 模 型 进行 
优化 ,得 到 的 整个 优化 问题 的 Pareto 前 沿 如 图 7-15 所 示 。 表 7-3 列 出 的 15 个 Pareto 优化 解 
都 满足 法 规 要 求 ,并 且 质 量 及 WIC 值 相对 于 初始 值 都 有 不 同 程度 的 降低 ,设计 者 可 根据 设计 
目标 进行 权衡 取舍 。 如 对 整 车 质量 关注 较 多 , 则 可 选择 解 4、15; 若 对 侧 碰 安全 性 考虑 较 多 ， 
则 可 选择 解 1;: 若 整 车 质量 和 侧 碰 安全 同等 重要 , 则 可 选择 解 9、10 和 11。 


近似 模型 满足 
精度 要 求 ? 


多 目标 遗传 算法 寻 优 
得 到 Pareto 解 集 
根据 设计 要 求 挑选 满意 解 
























综合 伤害 评估 值 WIC 
[= 
a 


满足 安全 性 和 0.60 
轻 量化 要 求 ? 
0.55 
Y 0.50 
6.5 7.$ 8.5 9.5 10.5 
质量 m/kg 
图 7-14 侧 磁 多 目标 优化 流程 图 7-15” 侧 碰 多 目标 优化 问题 的 Pareto 前 沿 


表 7-3 侧 碰 多 目标 优化 问题 的 Pareto 解 集 
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续 表 


Pareto 解 WIC 





0. 643 





0.651 





0.659 


0. 662 





0.668 





0.672 





0.678 





0. 683 
0. 692 
0.709 
0.739 


0.768 





本 例 采用 BP 神经 网 络 与 遗传 算法 相 结合 的 方法 求解 多 目标 优化 问题 ,发 挥 了 两 者 各 自 
的 优势 。 多 目标 遗传 算法 具有 多 点 搜索 的 特性 , 故 它 是 求解 多 目标 问题 Pareto 最 优 解 集 的 有 
效 方法 ;而 BP 神经 网 络 代 替 有 限 元 进行 优化 计算 ,解决 了 结构 重 构 问题 ,大 大 缩短 了 计算 时 
间 ,提高 了 优化 效率 ,而 且 计 算 结果 具有 足够 的 精度 。 
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